Las disputas entre proveedores de soluciones de IA generativa y titulares de derechos de contenido protegido por derechos de autor continúan creciendo. Y sin embargo, Abierto AI considera que la creación de herramientas de IA generativa es inviable sin el uso de estos contenidos para entrenarlas. En un informe presentado al Comité Selecto Digital y de Comunicaciones de la Cámara de los Lores, la startup afirma que sería imposible entrenar grandes modelos de lenguaje (LLM) como GPT-4, la tecnología subyacente de ChatGPT, sin utilizar contenido protegido. "Dado que los derechos de autor cubren hoy prácticamente todas las formas de expresión humana - incluyendo publicaciones de blogs, fotografías, publicaciones en foros, fragmentos de código de software y documentos gubernamentales - sería imposible entrenar los mejores modelos de IA actuales sin utilizar materiales protegidos por derechos de autor »

Las aplicaciones GenAI como ChatGPT o la herramienta de generación de imágenes Stable Diffusion se crean a partir de grandes cantidades de datos recopilados de Internet, muchos de los cuales están cubiertos por derechos de propiedad intelectual. Esta situación ha provocado la protesta de editores y autores, que afirman que su obra se utiliza sin crédito ni compensación.

Índice
  1. Preocupaciones por el código protegido por derechos de autor
  2. Aún más quejas

Preocupaciones por el código protegido por derechos de autor

"Los desarrolladores han estado utilizando recursos como Google y StackOverflow durante décadas", dijo Daniel Li, director ejecutivo de Plus Docs, una empresa cuyo software utiliza genAI para diseñar, crear y editar presentaciones. Según él, ChatGPT simplemente hace que la codificación sea un poco más fácil de usar. “Una cosa a tener en cuenta es que los desarrolladores siempre deben comprender su código. ChatGPT no cambia este requisito”, añadió. El ejecutivo reconoce que "las empresas deben tener mucho cuidado de no utilizar códigos u otros textos protegidos por derechos de autor". Y señala que “este ya es un tema importante en las adquisiciones de software para las grandes empresas tecnológicas, y este tema no hará más que aumentar en importancia”.

La postura de OpenAI se produce cuando la empresa enfrenta una serie de acciones legales. La semana pasada, el New York Times presentó una demanda contra OpenAI y Microsoft, un importante inversor en OpenAI y usuario de sus herramientas en varios productos de Microsoft. En esta denuncia, el New York Times acusa a las dos empresas de utilizar ilegalmente su contenido para crear herramientas OpenAI. En respuesta, la startup argumentó que la ley de derechos de autor no prohibía el entrenamiento de modelos genAI.

El año pasado, OpenAI fue objeto de una demanda colectiva federal en California, en la que los demandantes acusaron a la empresa de utilizar ilegalmente datos personales para entrenar sus modelos. La demanda, presentada en el Distrito Norte de California, alega 15 violaciones, incluida la Ley de Abuso y Fraude Informático y la Ley de Privacidad de las Comunicaciones Electrónicas, y varias leyes estatales de derechos del consumidor. La razón dada, en el centro de la demanda presentada en California, es que OpenAI “recopiló ilegalmente” los datos privados de los demandantes y los utilizó sin ofrecer compensación. Según la denuncia, "OpenAI utilizó estos datos malversados ​​para refinar y hacer avanzar ChatGPT con extensos modelos de lenguaje y algoritmos de lenguaje avanzados, permitiéndole producir y comprender un lenguaje similar al humano, una capacidad que se puede aplicar a una multitud de usos".

Aún más quejas

El caso de California es parte de una batalla legal cada vez más activa destinada a limitar la recopilación desenfrenada de datos mediante herramientas de inteligencia artificial generativa. Un grupo de autores presentó una demanda colectiva contra OpenAI y Microsoft, acusando a ambas empresas de violar los derechos de autor de los autores al utilizar sus escritos y trabajos académicos para formar ChatGPT sin autorización. El principal demandante es Julian Sancton, autor del libro “Manicomio en el fin de la Tierra: el viaje de Bélgica a la Antártida oscura”.

En este caso, OpenAI y Microsoft son acusados ​​de ignorar descaradamente las leyes de derechos de autor para crear "un negocio multimillonario mediante el uso no autorizado de las obras colectivas de la humanidad". En lugar de pagar por la propiedad intelectual, "actúan como si las leyes de derechos de autor no existieran". John Licato, profesor asistente de Ingeniería y Ciencias de la Computación en la Universidad del Sur de Florida, cree que la posición de OpenAI podría resultar en una infracción de derechos de autor. "La línea entre adaptar ideas existentes y crear algo verdaderamente nuevo ya es borrosa, y la IA nos está obligando a ver cuán mal definida está esa distinción", dijo John Licato.