[Hack] – Lutter contre les Crawlers !
Salut à tous,
Il m’arrive, je l’avoue de réaliser 2/3 crawlers à l’occasion, lorsque des amis ont besoin de récupérer des informations.
Aussi, cet article va vous donner un petit tuyau pour lutter contre les mecs comme moi ^^
En gros, l’idée c’est :
De bloquer l’accès à vos pages, lorsque vous constatez que l’ip du visiteur correspond étonnamment à l’IP d’un serveur !
Beaucoup de manière
de faire
…
Vous pouvez par exemple, contrôler via des interrogations DNS, si une IP est attachée à des noms de domaines ^^
Voici un petit script, qui lui se contente simplement de checker dans un WHOIS …
si l’IP appartient à OVH ou pas …
[pastacode lang= »php » message= » » highlight= » » provider= »manual »]
$ip = (preg_match("/([0-9]{0,3})\.([0-9]{0,3})\.([0-9]{0,3})\.([0-9]{0,3})/", $_SERVER['REMOTE_ADDR'], $ip))?$ip[0]:"";
if (empty($ip)) exit;
exec("whois $ip | grep OVH", $result);
if (! empty($result)) exit;
[/pastacode]
Désolé pour les abonnés internet OVH
Bref ça vous épargnera les crawlers installés sur des Kymsufi (au hasard …)
Nécessite l’installation de whois sur votre serveur :
# apt-get install whois
En tout cas, maintenant vous savez !
À vous de jouer en adaptant ce script en conséquence !
Dyrk.org