Cloudflare acusa a Perplexity de haber realizado un crawling ilegal de sitios web

Publié le 6 agosto 2025 à 09h54
modifié le 6 agosto 2025 à 09h54

Cloudflare acusa a Perplexity de un comportamiento ilícito, socavando la confianza en la web. La startup de inteligencia artificial se distingue por sus métodos de acceso a contenidos protegidos. El término *« crawling ilegal »* cristaliza las interrogantes sobre la ética digital.

La recolección de datos a menudo está regida por normas estrictas. Ignorar estas reglas debilita el fundamento mismo de la ciberseguridad. Perplexity afirma funcionar de manera diferente, pero sus acciones plantean graves preocupaciones.

La tensión entre la innovación tecnológica y el respeto por los derechos de los creadores prevalece en este debate. Las consecuencias potenciales sacuden el paisaje digital.

Acusaciones de Cloudflare

La empresa de ciberseguridad Cloudflare ha presentado acusaciones formales contra Perplexity. Le reprocha realizar un crawling ilegal de sitios web, eludiendo los dispositivos de seguridad y las reglas de recolección de datos.

Comportamiento de «stealth crawling»

Según Cloudflare, Perplexity adopta una estrategia de « stealth crawling », caracterizada por una exploración no autorizada de los sitios. Este método le permite acceder a datos ignorando las instrucciones estipuladas en los archivos robots.txt de los sitios afectados.

Frente a los bloqueos emitidos por cortafuegos, parece que Perplexity modifica su identidad digital. La empresa afirma así ocultar su agente de usuario y sus números de sistemas autónomos (ASN) para eludir las restricciones.

Pruebas realizadas por Cloudflare

Cloudflare ha reaccionado a varias quejas de clientes, alertando sobre un acceso no autorizado de los robots de Perplexity a sus sitios. La empresa de seguridad ha implementado pruebas. Ha creado páginas web desconocidas para los robots de Perplexity y ha bloqueado el crawling.

A pesar de estas medidas, Perplexity ha proporcionado información extraída de estas nuevas páginas. Las pruebas sugieren un comportamiento problemático que pone en cuestión la conformidad de los métodos de recolección de datos de la startup.

Respuesta de Perplexity

Ante las acusaciones de Cloudflare, Perplexity ha intentado defenderse. Según sus representantes, las herramientas utilizadas no serían robots en el sentido tradicional, sino « asistentes IA » activados por el usuario. Esta distinción busca disminuir el impacto de las acusaciones de crawling ilegal.

Perplexity insiste en que su sistema no almacena los datos recolectados ni los utiliza para su aprendizaje. La herramienta se centra simplemente en recuperar información relevante a solicitud del usuario, a diferencia de los crawlers clásicos.

Controversias persistentes

Esta situación alimenta las críticas ya numerosas hacia las empresas de inteligencia artificial. Estas a menudo son objeto de acusaciones sobre la recolección masiva de datos en la web sin consentimiento explícito. Estas prácticas plantean interrogantes éticas sobre el respeto a la privacidad y los derechos de los individuos.

A medida que estos conflictos legales emergen, la reputación de las empresas que operan en el sector de la IA continúa deteriorándose. Las acusaciones de Cloudflare contra Perplexity, aunque no resueltas, refuerzan las preocupaciones en torno a las prácticas de recolección de datos en un mundo cada vez más digital.

Para ejemplos de otros casos de litigios similares, basta con mirar hacia asuntos como el involucrando a Reddit y Anthropic por explotación ilegal de datos. Las cuestiones de ética y legalidad continúan siendo el centro del debate en el campo tecnológico.

Para más reflexiones sobre la evolución de la IA, el artículo vinculado a la mejora de modelos de IA, como Mistral AI, ofrece perspectivas intrigantes sobre estas tecnologías en constante evolución.

Preguntas frecuentes comunes

¿Cuáles son las acusaciones formuladas por Cloudflare contra Perplexity?
Cloudflare acusa a Perplexity de acceder a sitios web y recopilar datos sin autorización, eludiendo las medidas de seguridad establecidas por dichos sitios.

¿Qué es el «stealth crawling» mencionado por Cloudflare?
El «stealth crawling» se refiere a un método de exploración silenciosa donde un motor de búsqueda, como Perplexity, accede a los contenidos de un sitio sin respetar las reglas de los archivos robots.txt o de los cortafuegos.

¿Cómo justifica Perplexity su funcionamiento ante las acusaciones?
Perplexity sostiene que sus «asistentes IA» no son simples robots de exploración, sino agentes que recuperan datos en respuesta a consultas específicas de los usuarios sin almacenar esta información.

¿Cuáles son las consecuencias potenciales para Perplexity si se prueban las acusaciones?
Si las acusaciones de violación de derechos de acceso a datos se prueban, Perplexity podría enfrentar acciones legales, multas y daño a su reputación en el mercado de la IA.

¿Ha habido otros incidentes similares relacionados con empresas de IA?
Sí, las empresas de inteligencia artificial han sido criticadas anteriormente por recopilar datos sin consentimiento en la web, lo que ha suscitado preocupaciones éticas y legales.

¿Qué medidas pueden tomar los sitios web para proteger sus datos?
Los sitios web pueden utilizar archivos robots.txt, reglas de cortafuegos y otros sistemas de seguridad para evitar el acceso no autorizado de estas herramientas de exploración.

¿Es legal para Perplexity acceder a datos en sitios web?
La legalidad depende de las circunstancias, como el respeto hacia las reglas establecidas por los sitios sobre la exploración y recolección de datos. Ignorar estas reglas puede constituir una violación de derechos de autor o de los términos de uso.

¿Cómo descubrió Cloudflare el comportamiento de Perplexity?
Cloudflare recibió quejas de clientes y realizó pruebas creando sitios no indexados, donde Perplexity pudo acceder a pesar de las restricciones impuestas.

actu.iaNon classéCloudflare acusa a Perplexity de haber realizado un crawling ilegal de sitios...

Google presenta a Jules y Gemini CLI, sus agentes de IA dedicados a las acciones de GitHub

découvrez comment google révolutionne la gestion des actions github avec jules et gemini cli, ses nouveaux agents d'intelligence artificielle. apprenez à optimiser vos workflows de développement grâce à ces outils innovants.

Microsoft redirige las búsquedas «ChatGPT» y «Claude» en Bing para destacar su herramienta Copilot

découvrez comment microsoft redirige désormais les recherches pour « chatgpt » et « claude » sur bing, afin de promouvoir son nouvel outil copilot. cette stratégie met en lumière l'innovation de microsoft dans le domaine des technologies d'assistance et son ambition de renforcer son intégration dans les recherches en ligne.

Comprender la agentificación y la automatización: desafíos e impactos para su estrategia de datos

découvrez comment l'agentification et l'automatisation transforment votre stratégie data. analysez les enjeux et impacts clés pour optimiser vos processus et rester compétitif dans un monde de plus en plus numérique.

La llegada de la IA Act: un nuevo desafío para Europa y Estados Unidos

découvrez comment l'ia act, nouvelle législation sur l'intelligence artificielle, représente un défi majeur pour l'europe et les états-unis. analyse des implications réglementaires et des impacts sur l'innovation.
découvrez comment les groupes artistiques et médiatiques s'unissent pour alerter le gouvernement sur le vol massif de contenus australiens, en vue de protéger la création artistique contre les abus liés à l'entraînement de l'intelligence artificielle.

openai lanza modelos gratuitos y descargables para ponerse al día con la competencia

découvrez les nouveaux modèles gratuits et téléchargeables lancés par openai, conçus pour rattraper la concurrence. profitez de technologies avancées pour vos projets d'ia tout en bénéficiant d'une accessibilité sans précédent.