Meta bajo fuego de críticas por el uso de datos pirateados en el desarrollo de su inteligencia artificial

Publié le 13 enero 2025 à 08h09
modifié le 13 enero 2025 à 08h10

Meta se encuentra en el centro de la escena judicial, acusada de haber integrado obras protegidas en el desarrollo de su inteligencia artificial. Las implicaciones de este caso plantean interrogantes sobre la legalidad y la ética de las prácticas adoptadas por los gigantes tecnológicos. Tras revelaciones impactantes, Meta es sospechosa de haber explotado bases de datos pirateadas, provenientes de fuentes controvertidas, para entrenar sus modelos de IA.
Las acusaciones no se limitan al simple uso de obras de dominio público; también apuntan a una manipulación deliberada de las protecciones de derechos de autor. La situación pone de relieve la necesidad de regulaciones robustas frente a las prácticas de extracción de datos. Este caso podría redefinir los contornos de los derechos de autor dentro del entorno digital.

Meta bajo el fuego de las críticas por uso de datos pirateados

Los demandantes en el caso Kadrey y otros vs. Meta han presentado una moción acusando a la empresa de haber utilizado deliberadamente obras protegidas por derechos de autor durante el desarrollo de sus modelos de inteligencia artificial.

Entre los demandantes se encuentra el autor Richard Kadrey, quien ha presentado una «Réplica en apoyo a la solicitud de los demandantes para obtener permiso para presentar una tercera demanda enmendada consolidada» ante el tribunal de distrito del norte de California.

Piratería sistemática y explotación ilegal

Los documentos judiciales alegan que Meta ha realizado un uso sistemático de torrents y ha eliminado la información de gestión de derechos de autor (CMI) de los conjuntos de datos pirateados, incluidas las provenientes de la biblioteca fantasma LibGen.

Pruebas incriminatorias revelan la implicación de los directivos de Meta en estos métodos. Los demandantes sostienen que el CEO Mark Zuckerberg dio su aprobación explícita para el uso del conjunto de datos LibGen, a pesar de las preocupaciones planteadas por los responsables de IA de la empresa.

Un memorando interno de diciembre de 2024 reconoció que LibGen era «un conjunto de datos que sabemos que está pirateado.» Por lo tanto, surgieron discusiones sobre las consecuencias éticas y legales del empleo de tales materiales.

Comunicación interna y hesitación

Intercambios internos sugieren que, tras la adquisición del conjunto de datos LibGen, Meta eliminó las informaciones de gestión de derechos de autor de las obras protegidas. Esta práctica, destacada por los demandantes, se vuelve central en sus acusaciones de infracción de derechos de autor.

Michael Clark, representante de Meta, declaró que la empresa había implementado scripts para eliminar cualquier indicación de derechos de autor, incluyendo palabras clave como «copyright» y «agradecimientos.» Esta manipulación tenía como objetivo preparar el conjunto de datos para el entrenamiento de los modelos de IA Llama de Meta.

Las implicaciones éticas y legales

Las alegaciones pesan fuertemente sobre la imagen de Meta, retratando a la empresa como implicada en un esquema de piratería a gran escala. Correos electrónicos entre ingenieros de Meta revelan preocupaciones sobre la óptica del torrenting desde laptops de la empresa.

Un ingeniero expresó que «usar una laptop [de Meta] para un torrent no parece correcto,» sin embargo, la descarga rápida y la distribución de datos pirateados tuvo lugar.

El consejo jurídico de los demandantes afirmó que en enero de 2024, Meta ya había “torrentado (descargado y distribuido) datos desde LibGen.” Además, varios documentos relacionados habían sido inicialmente obtenidos por Meta, pero retenidos durante las fases iniciales de descubrimiento.

Declaraciones de Zuckerberg y ampliación de la denuncia

Durante un testimonio el 17 de diciembre de 2024, se dice que Zuckerberg admitió que tales acciones levantarían «muchas banderas rojas» y reconoció que esto “parece problemático,” aunque proporcionó pocas respuestas directas sobre las prácticas de entrenamiento de la IA de Meta.

Inicialmente, el caso se centraba en la infracción de la propiedad intelectual debido al uso por parte de la IA de materiales protegidos. Ahora, los demandantes buscan agregar dos acusaciones importantes: una violación de la ley de derechos de autor del milenio digital (DMCA) y una violación de la ley californiana de acceso y fraude de datos (CDAFA).

Los efectos potenciales sobre la legislación relativa a la IA

Los demandantes afirman que Meta ha retirado deliberadamente las protecciones de derechos de autor para ocultar usos no autorizados de textos protegidos en sus modelos Llama.

Las alegaciones sobre la CDAFA tocan las métodos de adquisición utilizadas para obtener el conjunto de datos LibGen, incluidas las acciones de torrenting para obtener contenidos protegidos.

En sus comunicaciones internas, ingenieros han expresado abiertamente sus preocupaciones sobre la legalidad del seeding y del torrenting, señalando que esto podría plantear problemas legales.

Un impacto en los derechos de autor y los creadores

Este conflicto ilustra la creciente necesidad de aclaraciones sobre la intersección entre la ley de derechos de autor y el desarrollo de la IA. Los demandantes sostienen que la eliminación de las protecciones de derechos de autor priva a los creadores de su justa compensación.

Meta continúa negando todas las acusaciones en este caso y aún no ha respondido públicamente a las declaraciones hechas durante el testimonio de Zuckerberg.

Esta situación ocurre en un momento en que la tensión mundial en torno a las tecnologías de IA generativa se intensifica. Otras empresas, como OpenAI y Google, también enfrentan críticas por el uso de datos protegidos para entrenar sus modelos.

Meta debe enfrentar estas alegaciones mientras posiciona la IA como un eje central de su estrategia futura, ya que las acusaciones de dependencia en bibliotecas pirateadas podrían comprometer sus ambiciones de liderazgo en el campo.

El caso Kadrey y otros vs. Meta podría tener repercusiones considerables en el desarrollo de modelos de IA en el futuro, abriendo la puerta a precedentes legales significativos.

Autores afirman que Zuckerberg aprobó el uso de libros pirateados.

Lúgubres transacciones en línea: fenómeno de desvío de cuerpos.

FAQ sobre Meta y el uso de datos pirateados

¿Cuáles son las acusaciones contra Meta con respecto al uso de datos pirateados?
Meta es acusado de haber explotado obras protegidas por derechos de autor, incluidos libros, para entrenar sus modelos de inteligencia artificial como Llama, sin autorización de los titulares de derechos.
¿Cómo justifica Meta el uso de estos datos pirateados?
Meta no ha proporcionado hasta ahora una explicación satisfactoria. Las alegaciones sugieren que ejecutivos dentro de la empresa, incluido Mark Zuckerberg, habrían aprobado el uso de estos datos a pesar de las preocupaciones éticas y legales.
¿Cuáles son los impactos potenciales de este caso en el desarrollo de la inteligencia artificial?
Este caso podría crear precedentes legales en relación a los derechos de autor y las prácticas de entrenamiento de modelos de IA, lo que podría influir en cómo las empresas tecnológicas adquieren y utilizan datos en el futuro.
¿Qué leyes están involucradas en este caso?
Las acusaciones incluyen violaciones del Digital Millennium Copyright Act (DMCA) y el Colorado Comprehensive Data Access and Fraud Act (CDAFA), que protegen los derechos de autor y regulan el acceso a los datos.
¿Pueden los creadores de contenido reclamar compensaciones a Meta?
Sí, los autores y titulares de derechos pueden demandar por infracción de derechos de autor y buscar obtener compensaciones si se validan las acusaciones contra Meta.
¿Cómo podría afectar el caso la reputación de Meta?
La dependencia supuesta de Meta en datos pirateados podría perjudicar su reputación, especialmente en un contexto donde se esfuerza por mantener su posición de liderazgo en innovación tecnológica.
¿Cuáles son los principales problemas éticos subrayados en este caso?
Los problemas éticos incluyen la legitimidad de utilizar obras protegidas para el entrenamiento de modelos de IA, así como el respeto de los derechos de los creadores en un entorno digital en constante evolución.
¿Cuál es la reacción del público y de las autoridades ante las acciones de Meta?
La reacción es mayormente negativa, con críticas crecientes sobre el impacto de tales prácticas en los creadores y sobre la equidad de los sistemas de IA desarrollados con datos no autorizados.
¿En qué marco legal se desarrolla actualmente este caso?
Este caso se encuentra actualmente en curso en el tribunal de distrito de los Estados Unidos en el norte de California, donde los demandantes buscan hacer valer sus derechos y ampliar las acusaciones contra Meta.
¿Cuáles son las implicaciones para otras empresas tecnológicas?
Los resultados de este caso podrían incitar a otras empresas a revisar sus prácticas de adquisición de datos y a respetar más los derechos de autor para evitar problemas legales similares.

actu.iaNon classéMeta bajo fuego de críticas por el uso de datos pirateados en...

el uso de la IA en el trabajo: un nuevo estudio revela que esto podría perjudicar su reputación

découvrez dans notre nouvelle étude comment l'utilisation de l'intelligence artificielle au travail peut impacter votre réputation professionnelle. analyse des risques et des bénéfices de l'ia dans le milieu professionnel.

La IA FaceAge utiliza una foto para determinar su edad biológica y orientar decisiones médicas esenciales.

découvrez faceage, une innovation en intelligence artificielle qui analyse votre photographie pour estimer votre âge biologique. grâce à cette technologie avancée, prenez des décisions médicales éclairées et adaptées à votre réelle condition. transformez votre santé avec une approche personnalisée!

las razones por las cuales Apple busca preservar a Google

découvrez pourquoi apple s'efforce de maintenir une relation privilégiée avec google, en explorant les enjeux stratégiques, économiques et technologiques derrière cette alliance inattendue. plongez dans les raisons qui motivent cette dynamique entre deux géants du secteur technologique.

las razones por las que las IA como ChatGPT pueden proporcionar información incorrecta

découvrez les différentes raisons pour lesquelles des intelligences artificielles, telles que chatgpt, peuvent produire des informations incorrectes. cet article explore les limites des algorithmes, les biais dans les données d'entraînement et d'autres facteurs susceptibles d'influencer la précision des réponses fournies par ces outils.

Descubre 10 extensiones de IA para Google Chrome que mejorarán tu día a día

découvrez comment 10 extensions ia pour google chrome peuvent transformer votre quotidien en optimisant votre productivité, simplifiant vos tâches et enrichissant votre expérience de navigation. explorez des outils innovants qui rendent votre journée plus efficace !
découvrez la nouvelle gamme d'ordinateurs et tablettes surface de microsoft, alliant accessibilité et performances grâce à des technologies d'intelligence artificielle avancées. profitez d'une expérience utilisateur enrichie et d'un rapport qualité-prix imbattable.