Pruebas judiciales revelan que Meta utilizó materiales protegidos por derechos de autor sin licencia para entrenar su IA
En uno de los casos judiciales más relevantes sobre propiedad intelectual e IA, Meta ha recibido graves acusaciones tras perder esta ‘batalla legal’. Un tribunal de California desclasificó recientemente importante información que implica a la Big Tech en el uso de datos piratas para entrenar sus modelos de IA. Según nuevos informes, Meta utilizó la base de datos LibGen (Library Genesis), una famosa biblioteca pirata que aloja miles de libros protegidos por derechos de autor, para alimentar su IA generativa, lo que ha provocado la demanda de los autores que lo han sufrido.
Este caso, conocido como Kadrey et al. v. Meta Platforms, comenzó en 2023, cuando los novelistas Richard Kadrey y Christopher Golden, junto con la comediante Sarah Silverman, demandaron a Meta por utilizar sus obras sin permiso para entrenar sus modelos de IA. A lo largo de la demanda, Meta ha defendido su práctica argumentando que el uso de datos públicos para entrenar herramientas de IA está cubierto por la doctrina de "uso justo", lo que en su opinión lo hace legal. Sin embargo, los documentos recientemente desclasificados revelan que Meta conocía perfectamente que estaba utilizando material pirateado, lo que pone en entredicho sus argumentos legales y éticos.
Según Wired, el juez Vince Chhabria, responsable de supervisar el caso en el Tribunal de Distrito de los Estados Unidos para el Distrito Norte de California, dictaminó que Meta no estaba buscando redacciones para proteger sus intereses comerciales, sino para evitar una mala publicidad. Entre los documentos desclasificados se incluye un comentario interno de un empleado de Meta que expresa su preocupación de que, si se descubriera que la empresa había utilizado LibGen, perderían una importante ventaja en sus negociaciones con los reguladores. A pesar de estas advertencias internas, Meta siguió adelante con el uso de la base de datos.
Además de las implicaciones legales de usar LibGen, la empresa está siendo acusada de distribuir material pirata. Los documentos revelan que Meta no solo descargó, sino que también subió archivos de libros piratas en webs de torrents, lo que agravaría aún más su responsabilidad legal. Este tipo de actividad coloca a Meta en una situación aún más delicada, ya que no solo estaría usando material protegido sin autorización, sino que además estaría participando activamente en su distribución.
LibGen, que comenzó en Rusia en 2008, ha sido objeto de numerosos juicios a lo largo de los años. En 2024, un juez de Nueva York ordenó que LibGen pagara 30 millones de dólares por infringir los derechos de autor, aunque la identidad de los administradores de la base de datos sigue siendo desconocida.
Este caso tiene implicaciones más amplias para la industria tecnológica, pues determinará cómo se regulan las prácticas de entrenamiento de IA con datos que están protegidos por derechos de autor. Si el tribunal falla en contra de Meta, podría sentar un precedente que afectaría a otras empresas tecnológicas que dependen de grandes volúmenes de datos para entrenar sus modelos de IA. Las consecuencias podrían ser significativas, ya que las empresas tecnológicas podrían verse obligadas a buscar métodos más costosos y éticamente responsables para obtener los datos necesarios para entrenar sus herramientas de IA.
Meta, que hasta ahora había intentado mantener en secreto el uso de LibGen, aún tiene la oportunidad de apelar el fallo. Sin embargo, la revelación de estos documentos sugiere que la empresa podría estar enfrentando más dificultades legales en el futuro cercano, lo que podría alterar la forma en que se manejan las relaciones entre la industria de la tecnología y los titulares de derechos de autor.
Este escándalo subraya las crecientes tensiones entre la innovación tecnológica y la protección de los derechos de autor, un tema central en la regulación de la inteligencia artificial y la economía digital.