[Hack] – Lutter contre les Crawlers !

Humain-robot-BF

 

Salut à tous,

 

Il m'arrive, je l'avoue de réaliser 2/3 crawlers à l'occasion, lorsque des amis ont besoin de récupérer des informations.

Aussi, cet article va vous donner un petit tuyau pour lutter contre les mecs comme moi ^^

En gros, l'idée c'est :
De bloquer l'accès à vos pages, lorsque vous constatez que l'ip du visiteur correspond étonnamment à l'IP d'un serveur !

 

Beaucoup de manière
de faire
...

 

Vous pouvez par exemple, contrôler via des interrogations DNS, si une IP est attachée à des noms de domaines ^^

Voici un petit script, qui lui se contente simplement de checker dans un WHOIS ...
si l'IP appartient à OVH ou pas ...

 

$ip = (preg_match("/([0-9]{0,3})\.([0-9]{0,3})\.([0-9]{0,3})\.([0-9]{0,3})/", $_SERVER['REMOTE_ADDR'], $ip))?$ip[0]:"";

if (empty($ip)) exit;
exec("whois $ip | grep OVH", $result);
if (! empty($result)) exit;

Désolé pour les abonnés internet OVH

Bref ça vous épargnera les crawlers installés sur des Kymsufi (au hasard ...)

Nécessite l'installation de whois sur votre serveur :
# apt-get install whois

 

En tout cas, maintenant vous savez !
À vous de jouer en adaptant ce script en conséquence !

Laisser une réponse

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site est protégé par reCAPTCHA et le GooglePolitique de confidentialité etConditions d'utilisation appliquer.