Perplexity, récemment plébiscité pour ses capacités révolutionnaires, se retrouve au cœur d’une tourmente. Des accusations d’utilisation non autorisée de contenus émergent, portées par Cloudflare dans un rapport saisissant. La pratique du « scrapping » contestée soulève des interrogations sur l’éthique des moteurs de recherche. Les robots de Perplexity, accusés de contourner les restrictions imposées par les sites web, voient leurs actions remises en question. La possibilité d’une réglementation stricte sur l’accès aux données pourrait transformer le paysage numérique.
Des accusations graves de contournement des restrictions
Moins d’un mois après le lancement de son projet Comet, Perplexity, un navigateur basé sur l’intelligence artificielle et accessible uniquement via l’abonnement Perplexity Max, fait face à des accusations sérieuses. Cloudflare, le service en ligne d’accélération et de protection des sites web, a récemment publié un rapport qui remet en question les pratiques de scrapping de Perplexity.
Le scrapping controversé des robots
Depuis son avènement, Perplexity a su s’établir comme un acteur de premier plan dans le secteur de l’intelligence artificielle, grâce à sa capacité à effectuer des recherches approfondies sur le web. Toutefois, cette fonctionnalité suscite des interrogations quant au respect des règles imposées par les propriétaires de sites web. Ces derniers, souvent, stipulent qu’ils ne souhaitent pas être visités par des crawlers, c’est-à-dire les robots d’exploration utilisés par les moteurs de recherche.
Les sites peuvent indiquer ces préférences dans un fichier nommé robots.txt, ou via des filtres de type WAF (Web Application Firewall). Selon le rapport de Cloudflare, Perplexity aurait contourner ces restrictions, accédant à des informations sensibles tout en masquant son activité en cas de blocage.
Les constatations de Cloudflare
Cloudflare cite des anomalies dans le comportement des robots PerplexityBot et Perplexity-User. Ce rapport soulève des questions quant aux pratiques de scrapping, confirmant que ces robots auraient eu accès à des données via des techniques pour masquer leur identité. Des captures d’écran appuient ces allégations, montrant des données potentiellement compromises.
La réaction de Perplexity
La réaction de Perplexity face à ces accusations est immédiate. Jesse Dwyer, porte-parole de l’entreprise, a qualifié le rapport de Cloudflare comme étant un simple coup de pub. Il a également mentionné que cette étude contenait plusieurs incohérences susceptibles d’invalider les conclusions présentées.
Des préoccupations sur le modèle économique de Cloudflare
En parallèle, Cloudflare a commencé à envisager d’introduire un modèle économique où les intelligences artificielles seraient tenues de payer pour scrapper des sites web, baptisé Pay per Crawl. Le danger d’un tel système pourrait affaiblir l’accès à l’information sur Internet, posant ainsi des questions éthiques sur l’ouverture du web.
Un débat en cours
La controverse entre ces deux entreprises soulève un débat brûlant dans le domaine de l’intelligence artificielle et de l’éthique numérique. Les implications de ces accusations pourraient influencer l’avenir des relations entre les IA et les sites web, avec des enjeux tant commerciaux que légaux.
Pour en savoir plus sur le sujet, des articles tels que celui sur la légende musicale ou les récentes innovations comme l’outil de recherche de ChatGPT mettent en contexte cette problématique.
Foire aux questions courantes
Quelles sont les accusations portées contre Perplexity par Cloudflare ?
Cloudflare accuse Perplexity d’avoir contourné les règlements de « robots.txt » et d’avoir scrappé des contenus sur des sites web sans autorisation, en utilisant des techniques pour masquer leur activité.
Comment Perplexity réalise-t-il ses recherches sur le web ?
Perplexity utilise des robots appelés « crawlers » pour visiter des pages web et extraire le contenu. Cela nécessite un processus connu sous le nom de « scrapping ».
Que signifie le terme « scrapping » dans le contexte de Perplexity ?
Le « scrapping » fait référence à la méthode que les robots de Perplexity emploient pour collecter des informations sur le web en accédant à différents sites.
Quelle est la réaction de Perplexity face aux accusations de Cloudflare ?
Perplexity a qualifié le rapport de Cloudflare de « coup de pub » et a affirmé que l’étude contenait de nombreuses incohérences et ne reflétait pas leur fonctionnement réel.
Quelles mesures peuvent prendre les sites web pour empêcher le scraping par des robots comme ceux de Perplexity ?
Les sites web peuvent utiliser un fichier « robots.txt » pour indiquer aux crawlers quelles pages ils ne souhaitent pas qu’elles soient consultées et appliquer des filtres WAF pour bloquer le trafic indésirable.
Quelles preuves Cloudflare a-t-il présentées pour soutenir ses accusations contre Perplexity ?
Cloudflare a fourni des captures d’écran et des données montrant que des robots de Perplexity auraient accédé à des sites web malgré des interdictions explicites, ainsi que des indications de modification des numéros ASN pour dissimuler leurs activités.
La controverse autour de Perplexity pourrait-elle avoir un impact sur l’entreprise ?
La controverse pourrait affecter la réputation de Perplexity et sa relation avec les sites web concernés, ainsi que son modèle d’abonnement basé sur l’intelligence artificielle.