Editoriales francesas demandan a Meta por copyright, pero la IA sigue operando sin castigo

Editoriales francesas demandan a Meta por copyright, pero la IA sigue operando sin castigo

La inteligencia artificial y el dilema del copyright: muchas demandas, pocas consecuencias

Las empresas de inteligencia artificial han construido sus modelos con grandes volúmenes de datos. El problema es de dónde han salido esos datos. Documentos, imágenes, libros y código han sido utilizados sin el permiso de sus creadores, lo que ha desatado una batalla legal que sigue sin resolverse. Y lo más sorprendente es que, a pesar de las numerosas demandas, las consecuencias para estas empresas han sido mínimas.

Las editoriales francesas han sido las últimas en levantar la voz. Cansadas de que su contenido sea utilizado sin compensación, han demandado a Meta por entrenar su IA con libros protegidos por derechos de autor. Pero no son las primeras ni serán las últimas. Antes que ellas, Getty Images denunció a Stable Diffusion por usar sus fotos sin permiso, OpenAI fue demandada por entrenar su modelo de código con repositorios de GitHub sin autorización, y The New York Times está inmerso en una de las demandas más importantes contra OpenAI. Sin embargo, hasta ahora, los tribunales parecen inclinarse a favor de las empresas de IA.

El caso de The New York Times podría cambiar el panorama. La demanda, iniciada en enero de 2025, busca demostrar que el periódico ha sufrido un daño económico real al ser usado como fuente para entrenar modelos de lenguaje. OpenAI ha argumentado que su uso de contenido es “justo” y que no viola el copyright. Sin embargo, su estrategia es contradictoria: mientras defienden el uso libre de datos, han firmado acuerdos millonarios con plataformas como Reddit y medios como El País para evitar futuros problemas legales.

Lo de Meta es aún más grave. Hace poco se reveló que la empresa utilizó más de 80 terabytes de libros descargados desde BitTorrent, muchos de ellos protegidos por copyright, para entrenar su modelo de IA. Este caso ha sido especialmente polémico, ya que no se trató solo de acceder a contenido disponible en internet, sino de recurrir directamente a bases de datos piratas. Las editoriales francesas han decidido llevar esto a los tribunales, pero la historia nos dice que las posibilidades de éxito son inciertas.

Las sentencias hasta ahora han sido decepcionantes para los creadores de contenido. En julio de 2024, un juez de California desestimó la mayoría de las reclamaciones contra GitHub Copilot, un sistema entrenado con código de desarrolladores sin su consentimiento. OpenAI también ganó una demanda similar. La tendencia parece clara: las empresas de IA están saliendo airosas de los litigios o logran esquivar problemas con acuerdos estratégicos.

Mientras tanto, la sociedad sigue fascinada con la inteligencia artificial. Cada día más herramientas se incorporan a nuestra vida, y los beneficios que ofrecen parecen eclipsar la pregunta clave: ¿cómo se entrenaron? Pareciera que el debate sobre el copyright en IA ha quedado en un segundo plano. Y quizás sea porque, en la práctica, las reglas aún no se han escrito.