Categorías:
Tendencias e información del sector de IA
Publicado en:
4/19/2025 1:45:00 PM

El dilema digital de los derechos de autor: las fronteras legales y éticas de la IA generativa

En la era del rápido avance de la inteligencia artificial, la IA generativa, con su asombrosa capacidad creativa, está arrasando el mundo, desde texto e imágenes hasta música y vídeo. Sin embargo, al tiempo que nos maravillamos de los avances tecnológicos, un problema fundamental se hace cada vez más evidente: las cuestiones de derechos de autor relacionadas con estos sistemas de IA en el proceso de creación. A medida que los límites de la "creación" de las máquinas se difuminan, el marco jurídico tradicional de los derechos de autor se enfrenta a retos sin precedentes. Este artículo profundizará en el dilema de los derechos de autor que plantea la IA generativa, analizará los casos existentes y los avances legales, y reflexionará sobre posibles vías de solución.

Datos de entrenamiento: el punto de partida de las controversias sobre derechos de autor

La capacidad de la IA generativa proviene de sus datos de entrenamiento. Ya se trate de GPT, DALL-E, Midjourney o Stable Diffusion, estos modelos aprenden técnicas creativas estudiando vastas cantidades de obras creadas por humanos. Sin embargo, este proceso básico de entrenamiento plantea el primer rompecabezas de los derechos de autor.

Adquisición de datos y la controversia del "uso justo"

Los datos de entrenamiento de los grandes modelos lingüísticos de empresas como OpenAI y Anthropic contienen grandes cantidades de texto de Internet, incluido contenido protegido por derechos de autor. Según una investigación del New York Times, los datos de entrenamiento de OpenAI contenían más de 11.000 libros, incluidos bestsellers no autorizados. Esto ha dado lugar a varias demandas importantes:

  • En diciembre de 2023, el New York Times demandó a OpenAI y Microsoft, acusándolas de utilizar millones de artículos de noticias protegidos por derechos de autor sin permiso para entrenar a ChatGPT.
  • El escritor George Martin (autor de Juego de Tronos) y otros 17 autores de renombre demandaron colectivamente a OpenAI por infracción de derechos de autor.
  • Getty Images demandó a Stability AI (desarrollador de Stable Diffusion), acusándola de extraer millones de fotos de Getty sin autorización para entrenar.

El principal punto de controversia en estos casos es que las empresas de IA argumentan que su uso de los datos entra dentro de la categoría de "uso justo" (Fair Use) según la ley de derechos de autor estadounidense porque:

  1. No copian ni muestran directamente el contenido original.
  2. El modelo extrae patrones, no contenido específico, de los datos.
  3. Este uso tiene una "naturaleza transformadora" y sirve a un propósito diferente.

Sin embargo, los creadores de contenido argumentan que:

  1. Las empresas comerciales utilizan contenido protegido por derechos de autor a gran escala sin autorización para obtener beneficios.
  2. Los productos de IA compiten directamente con los autores originales en el mercado.
  3. No se proporciona ningún mecanismo de compensación.

La sentencia preliminar del Tribunal del Distrito Sur de Nueva York de EE.UU. en el caso "Andersen contra Stability AI" en 2023 puede ser orientativa. El juez dictaminó que argumentar el uso justo simplemente porque se utiliza para entrenar a la IA es insuficiente y requiere un análisis específico de cada situación.

Excepciones de minería de datos de la UE y diferencias globales

A diferencia de Estados Unidos, la UE ofrece explícitamente una "excepción de minería de textos y datos" en su ley de derechos de autor. Los artículos 3 y 4 de la Directiva sobre el mercado único digital permiten a las organizaciones de investigación y a otras entidades realizar minería de textos y datos, pero el artículo 4 también otorga a los titulares de derechos el derecho de "exclusión voluntaria".

La ley de derechos de autor japonesa es aún más abierta y permite explícitamente el uso de contenido protegido por derechos de autor con fines de análisis de datos, lo que convierte a Japón en un entorno favorable para la investigación de la IA.

Esta incoherencia en el marco jurídico mundial ha dado lugar a un fenómeno de "arbitraje jurídico" en el desarrollo de la IA, en el que las empresas pueden optar por entrenar sus modelos en regiones con entornos legales más permisivos.

Contenido generado por IA: ¿quién es el creador?

Otra cuestión central es: ¿a quién debe pertenecer el contenido generado por la IA? ¿Puede estar protegido por derechos de autor?

Diferentes posiciones de los organismos de derechos de autor mundiales

En 2023, la Oficina de Derechos de Autor de EE.UU. denegó la protección de los derechos de autor a la imagen "Teatro D'opera Spatial" generada por Midjourney, y declaró explícitamente en su declaración de política "IA y derechos de autor": "El principio del autor humano es la piedra angular de la protección de los derechos de autor. La ley de derechos de autor estadounidense sólo protege la creación intelectual humana." Sin embargo, la Oficina de Derechos de Autor también indicó que las obras en las que los humanos colaboran con la IA pueden protegerse en la parte en la que los humanos aportan creatividad.

La Oficina de Propiedad Intelectual del Reino Unido ha adoptado una postura más flexible. Según su guía Copyright and AI-generated Works, las obras generadas por IA pueden estar protegidas por derechos de autor, pero el "autor" se considerará "la persona que haya tomado las disposiciones para que se cree la obra".

La ley de derechos de autor china, modificada en 2020, tampoco excluye explícitamente la creación por parte de la IA, lo que en cierta medida proporciona espacio para la protección de los derechos de autor del contenido generado por la IA.

Lecciones de casos emblemáticos

En 2022, el escritor estadounidense Charles Bazán intentó registrar los derechos de autor de su novela Zarya of the Dawn, que contenía ilustraciones generadas por Midjourney. La Oficina de Derechos de Autor finalmente concedió los derechos de autor sólo para la parte de texto y denegó la parte de imagen.

Más controvertido aún es que GitHub Copilot de Microsoft y OpenAI se enfrenta a una demanda colectiva por la posible inclusión de fragmentos de código original de los datos de entrenamiento en el código generado. Este fenómeno de "memoria" ha suscitado preocupación sobre si los sistemas de IA copiarán directamente el contenido original.

Similitud de obras: la difusa línea entre inspiración y plagio

Otra cuestión que plantea la IA generativa es: cuando el contenido generado por la IA es similar a las obras existentes, ¿cómo se determina si constituye una infracción?

"Imitación de estilo" y límites de los derechos de autor

La controversia más típica proviene del campo de la generación de imágenes. Los usuarios pueden pedir a la IA que "cree al estilo de Van Gogh" o "como una animación de Disney", lo que plantea la preocupación por el plagio de estilo. En 2023, varios artistas, entre ellos Kelly McKernan y Greg Rutkowski, presentaron una demanda en la que acusaban a Stability AI y Midjourney de infringir su estilo artístico.

Sin embargo, la ley de derechos de autor tradicional no protege el estilo, la técnica o la idea, sino sólo la expresión específica. Este principio se enfrenta a desafíos en la era de la IA, porque la IA puede aprender sistemáticamente e imitar las características del estilo de un artista.

Eliminación de elementos originales de los datos de entrenamiento

Algunas empresas de IA están intentando mitigar los riesgos de derechos de autor por medios técnicos:

  • OpenAI ha añadido un filtro en DALL-E 3 que se niega a generar solicitudes que imiten el estilo de un artista concreto.
  • El modelo Claude de Anthropic se niega a repetir contenido completo protegido por derechos de autor.
  • Midjourney prohíbe explícitamente a los usuarios introducir los nombres de determinados artistas conocidos como indicaciones.

Sin embargo, la investigación demuestra que la eficacia de estas medidas es limitada. Investigadores de la Universidad de Stanford descubrieron que, incluso sin utilizar directamente el nombre del artista, el uso de términos descriptivos relacionados puede permitir a la IA generar obras de estilo similar.

Legislación y adaptación del mercado: el camino a seguir

Ante estos retos, legisladores, empresas y creadores de todo el mundo están explorando diferentes vías:

Nuevos intentos legislativos

La Ley de IA de la UE exige que los proveedores de IA generativa revelen el contenido protegido por derechos de autor utilizado en su formación y proporcionen a los titulares de derechos un mecanismo de exclusión voluntaria.

El proyecto de ley estadounidense Clarifying Lawful Use of Our Prized Property Act (Ley CLUE) presentado en el Senado de EE.UU. pretende aclarar si el entrenamiento de la IA constituye un uso justo, pero hasta el momento no ha sido aprobado.

Las Directrices sobre el refuerzo de la protección de los derechos de autor del contenido generado por la inteligencia artificial publicadas en 2023 por la Administración Nacional de Derechos de Autor de China proponen que el contenido generado por la inteligencia artificial puede obtener la protección de los derechos de autor si tiene originalidad y se expresa creativamente por personas físicas.

Modelos de licencia y compensación

Algunas empresas han empezado a explorar modelos de licencia:

  • Associated Press ha llegado a un acuerdo con OpenAI para autorizar a esta última a utilizar sus archivos de noticias.
  • Shutterstock ha establecido una colaboración con OpenAI y Stability AI para permitir el uso de su biblioteca de imágenes para entrenar a la IA y establecer un fondo de compensación.
  • Adobe Stock ha creado un programa de licencias "favorable a la IA generativa" que permite explícitamente que parte del contenido se utilice para el entrenamiento de la IA.

Estos acuerdos representan una posible solución de mercado: garantizar que los creadores originales reciban una compensación mediante acuerdos de licencia directa.

Soluciones técnicas

Tecnologías como la cadena de bloques y las marcas de agua digitales también se han propuesto como herramientas para resolver problemas de derechos de autor:

  • El estándar de autenticación de contenido desarrollado por C2PA (Content Provenance and Authenticity Alliance) ayuda a identificar el contenido generado por la IA.
  • Midjourney y DALL-E incrustan metadatos en las imágenes generadas para indicar su origen en la IA.
  • Algunas empresas emergentes han desarrollado herramientas que pueden identificar la diferencia entre el contenido generado por la IA y la creación humana.

Equilibrio entre múltiples partes: replanteamiento de los intereses de todas las partes

Resolver el problema de los derechos de autor de la IA generativa requiere encontrar un equilibrio entre múltiples partes interesadas:

Derechos e intereses legítimos de los creadores de contenido

Los autores originales tienen derecho a ser protegidos y compensados. El sindicato de actores SAG-AFTRA incluyó las restricciones al uso de la IA como una de las demandas centrales en su huelga de 2023, y el acuerdo final requiere que los productores obtengan el consentimiento y proporcionen una compensación antes de utilizar la IA para replicar las imágenes de los actores.

Del mismo modo, la industria musical está explorando activamente mecanismos de protección. El CEO de Universal Music Group, Lucian Grainge, declaró en 2023: "La IA puede ser una herramienta para los artistas, pero no un sustituto".

Desarrollo tecnológico e interés público

Al mismo tiempo, unas restricciones demasiado estrictas pueden obstaculizar el progreso tecnológico y el beneficio social. Los investigadores de la IA señalan que si cada dato de entrenamiento requiere una autorización individual, el coste de desarrollo del modelo sería prohibitivo y limitaría la innovación.

Una posible solución equilibrada es establecer un sistema de licencia legal, similar al sistema de licencia mecánica de la industria musical, que permita el uso de contenido protegido pero requiera el pago de una tarifa razonable.

Conclusión: hacia un futuro simbiótico

El reto de los derechos de autor que plantea la IA generativa no tiene una solución sencilla. La velocidad del desarrollo tecnológico supera con creces la de los ajustes legales, y esta brecha requiere un esfuerzo conjunto de múltiples partes.

La dirección de desarrollo más probable en el futuro es: mejora gradual del marco jurídico, innovación en los modelos de licencia comercial, apoyo de herramientas técnicas y un diálogo y cooperación más profundos entre todas las partes interesadas. En este proceso, debemos proteger los derechos legítimos de los creadores y proporcionar espacio para la innovación tecnológica, estableciendo en última instancia un ecosistema en el que la IA y la creatividad humana coexistan.

Así como el propósito fundamental de la ley de derechos de autor es promover el desarrollo del conocimiento y la cultura, ante los retos de la era de la IA, necesitamos volver a este concepto central y encontrar un equilibrio que incentive tanto la creatividad humana como la innovación tecnológica. No se trata sólo de una cuestión legal, sino de una reflexión profunda sobre cómo definimos la propia creatividad y cómo deben coexistir los humanos y las máquinas en esta nueva era.

Lectura recomendada: