Perplexity sous le feu des critiques pour avoir prétendument utilisé des contenus sans autorisation, d’après Cloudflare

Publié le 5 août 2025 à 10h08
modifié le 5 août 2025 à 10h08
Hugo Mollet
Hugo Mollet
Rédacteur en chef pour la rédaction média d'idax, 36 ans et dans l'édition web depuis plus de 18 ans. Passionné par l'IA depuis de nombreuses années.

Perplexity, récemment plébiscité pour ses capacités révolutionnaires, se retrouve au cœur d’une tourmente. Des accusations d’utilisation non autorisée de contenus émergent, portées par Cloudflare dans un rapport saisissant. La pratique du « scrapping » contestée soulève des interrogations sur l’éthique des moteurs de recherche. Les robots de Perplexity, accusés de contourner les restrictions imposées par les sites web, voient leurs actions remises en question. La possibilité d’une réglementation stricte sur l’accès aux données pourrait transformer le paysage numérique.

Des accusations graves de contournement des restrictions

Moins d’un mois après le lancement de son projet Comet, Perplexity, un navigateur basé sur l’intelligence artificielle et accessible uniquement via l’abonnement Perplexity Max, fait face à des accusations sérieuses. Cloudflare, le service en ligne d’accélération et de protection des sites web, a récemment publié un rapport qui remet en question les pratiques de scrapping de Perplexity.

Le scrapping controversé des robots

Depuis son avènement, Perplexity a su s’établir comme un acteur de premier plan dans le secteur de l’intelligence artificielle, grâce à sa capacité à effectuer des recherches approfondies sur le web. Toutefois, cette fonctionnalité suscite des interrogations quant au respect des règles imposées par les propriétaires de sites web. Ces derniers, souvent, stipulent qu’ils ne souhaitent pas être visités par des crawlers, c’est-à-dire les robots d’exploration utilisés par les moteurs de recherche.

Les sites peuvent indiquer ces préférences dans un fichier nommé robots.txt, ou via des filtres de type WAF (Web Application Firewall). Selon le rapport de Cloudflare, Perplexity aurait contourner ces restrictions, accédant à des informations sensibles tout en masquant son activité en cas de blocage.

Les constatations de Cloudflare

Cloudflare cite des anomalies dans le comportement des robots PerplexityBot et Perplexity-User. Ce rapport soulève des questions quant aux pratiques de scrapping, confirmant que ces robots auraient eu accès à des données via des techniques pour masquer leur identité. Des captures d’écran appuient ces allégations, montrant des données potentiellement compromises.

La réaction de Perplexity

La réaction de Perplexity face à ces accusations est immédiate. Jesse Dwyer, porte-parole de l’entreprise, a qualifié le rapport de Cloudflare comme étant un simple coup de pub. Il a également mentionné que cette étude contenait plusieurs incohérences susceptibles d’invalider les conclusions présentées.

Des préoccupations sur le modèle économique de Cloudflare

En parallèle, Cloudflare a commencé à envisager d’introduire un modèle économique où les intelligences artificielles seraient tenues de payer pour scrapper des sites web, baptisé Pay per Crawl. Le danger d’un tel système pourrait affaiblir l’accès à l’information sur Internet, posant ainsi des questions éthiques sur l’ouverture du web.

Un débat en cours

La controverse entre ces deux entreprises soulève un débat brûlant dans le domaine de l’intelligence artificielle et de l’éthique numérique. Les implications de ces accusations pourraient influencer l’avenir des relations entre les IA et les sites web, avec des enjeux tant commerciaux que légaux.

Pour en savoir plus sur le sujet, des articles tels que celui sur la légende musicale ou les récentes innovations comme l’outil de recherche de ChatGPT mettent en contexte cette problématique.

Foire aux questions courantes

Quelles sont les accusations portées contre Perplexity par Cloudflare ?
Cloudflare accuse Perplexity d’avoir contourné les règlements de « robots.txt » et d’avoir scrappé des contenus sur des sites web sans autorisation, en utilisant des techniques pour masquer leur activité.

Comment Perplexity réalise-t-il ses recherches sur le web ?
Perplexity utilise des robots appelés « crawlers » pour visiter des pages web et extraire le contenu. Cela nécessite un processus connu sous le nom de « scrapping ».

Que signifie le terme « scrapping » dans le contexte de Perplexity ?
Le « scrapping » fait référence à la méthode que les robots de Perplexity emploient pour collecter des informations sur le web en accédant à différents sites.

Quelle est la réaction de Perplexity face aux accusations de Cloudflare ?
Perplexity a qualifié le rapport de Cloudflare de « coup de pub » et a affirmé que l’étude contenait de nombreuses incohérences et ne reflétait pas leur fonctionnement réel.

Quelles mesures peuvent prendre les sites web pour empêcher le scraping par des robots comme ceux de Perplexity ?
Les sites web peuvent utiliser un fichier « robots.txt » pour indiquer aux crawlers quelles pages ils ne souhaitent pas qu’elles soient consultées et appliquer des filtres WAF pour bloquer le trafic indésirable.

Quelles preuves Cloudflare a-t-il présentées pour soutenir ses accusations contre Perplexity ?
Cloudflare a fourni des captures d’écran et des données montrant que des robots de Perplexity auraient accédé à des sites web malgré des interdictions explicites, ainsi que des indications de modification des numéros ASN pour dissimuler leurs activités.

La controverse autour de Perplexity pourrait-elle avoir un impact sur l’entreprise ?
La controverse pourrait affecter la réputation de Perplexity et sa relation avec les sites web concernés, ainsi que son modèle d’abonnement basé sur l’intelligence artificielle.

Hugo Mollet
Hugo Mollet
Rédacteur en chef pour la rédaction média d'idax, 36 ans et dans l'édition web depuis plus de 18 ans. Passionné par l'IA depuis de nombreuses années.
actu.iaNewsPerplexity sous le feu des critiques pour avoir prétendument utilisé des contenus...

Microsoft redirige les recherches « ChatGPT » et « Claude » sur Bing pour mettre en avant son outil...

découvrez comment microsoft redirige désormais les recherches pour « chatgpt » et « claude » sur bing, afin de promouvoir son nouvel outil copilot. cette stratégie met en lumière l'innovation de microsoft dans le domaine des technologies d'assistance et son ambition de renforcer son intégration dans les recherches en ligne.

Comprendre l’agentification et l’automatisation : enjeux et impacts pour votre stratégie data

découvrez comment l'agentification et l'automatisation transforment votre stratégie data. analysez les enjeux et impacts clés pour optimiser vos processus et rester compétitif dans un monde de plus en plus numérique.

Cloudflare met en accusation Perplexity pour avoir effectué un crawling illégal de sites web

découvrez les tensions entre cloudflare et perplexity, alors que cette dernière est accusée d'avoir effectué un crawling illégal sur des sites web. analysez les implications légales et techniques de cette affaire retentissante dans le monde du web.

L’arrivée de l’IA Act : un nouveau défi pour l’Europe et les États-Unis

découvrez comment l'ia act, nouvelle législation sur l'intelligence artificielle, représente un défi majeur pour l'europe et les états-unis. analyse des implications réglementaires et des impacts sur l'innovation.
découvrez comment les groupes artistiques et médiatiques s'unissent pour alerter le gouvernement sur le vol massif de contenus australiens, en vue de protéger la création artistique contre les abus liés à l'entraînement de l'intelligence artificielle.

openai lance des modèles gratuits et téléchargeables pour rattraper la concurrence

découvrez les nouveaux modèles gratuits et téléchargeables lancés par openai, conçus pour rattraper la concurrence. profitez de technologies avancées pour vos projets d'ia tout en bénéficiant d'une accessibilité sans précédent.