Lorsque Qwant, offre une API aux Pirates
Nous connaissions les Googles Dorks, et désormais nous parlerons de Qwant Dorks ;)
Vous savez ?
Ce fameux moteurs de recherche qui se tire la bourre avec Google, pour une affaire de logo.
Et bien saviez vous qu'il offre une super API !
Une API qui permet de récupérer au format JSON, les informations retournées par votre recherche (lien, description, titre, ... ) !
Alors en quoi, est-ce une opportunité pour les pirates ?
Et bien, il n'y a aucune sécurité, ou contrôle que ce soit, pour s'assurer que c'est une humain qui fait ce qu'il fait.
Lorsque sur Google, nous effectuons à répétition, des requêtes "suspectes", hop la sécurité s'active.
Mais pas sur Qwant ...
Un robot automatisé, peut alors, effectuer des requêtes ciblées en utilisant cette API.
Il n'aura même pas à parser le contenu d'une page HTML, Javascript, avec des regex, ...
Tout sera déjà formaté et prêt à être utilisé ...
Bref une véritable mine pour les crawlers !
Pour l'utiliser rien de plus simple :
https://api.qwant.com/egp/search/web?count=30&q=.php?id=&offset=10
On indique dans la variable :
- "count", le nombre de résultat, que l'on souhaite récupérer
- "q", le / les terme(s) à rechercher
- "offset", la gestion des pages (à partir de quel résultat on commence à compter)
Cool, merci du partage !
Quand je la jour dans mon browser, ça marche. Mais je suis redirigé vers une page d’erreur sur http://www.qwant.com quand je l’appelle d’un programme. Comment faire?
Curl + faux user Agent
Comme ça tu donne l impression de venir depuis un navigateur ;)
Pingback: [Qwant] Comment modifier les réglages d’un utilisateur distant | Dyrk
je vois pas en quoi c’est un problème que des programmes puissent récupérer facilement des informations publiques…
Tu peux surcharger le serveur de requêtes.
On peut se poser la question de la sécurité PARTOUT sur leur site du coup…
Oui, mais pas plus qu’en utilisant directement l’URL: https://www.qwant.com/?q=<recherche>
Comme dit au dessus, les informations sont déjà en libre service, donc je ne vois absolument pas le problème. Google n’est pas un exemple sur tout, mettre du captcha à toutes les sauces n’est pas la seule solution pour limiter le nombre de requête.
Je découvre les api. Merci pour ce quelques détails sur celle de qwant.