Uno de los debates que surgen regularmente en la comunidad open source es la contribución –en días-hombre, con la provisión de instancias para pruebas o en efectivo– a los proyectos realizados por las distintas fundaciones (Apache, CNCF o Linux). Incluso si, en realidad, el operador comercial (los hiperescaladores, por ejemplo) siempre toma más de lo que aporta. Y este patrón se reproduce a muy gran escala con bots tipo ChatGPT y generadores de imágenes como Dall-E, que se basan en LLM (grandes modelos de lenguaje) con una gran cantidad de parámetros (generalmente del orden de mil millones o más). Como explica un artículo de WiredOpenAI, el creador de ChatGPT y Dall-E, ofrece ahora ofertas comerciales (compra de tokens) para acceder a su plataforma de IA explotando conjuntos de datos de millones de fuentes en línea.
Y ciertos sitios comunitarios como Stack Overflow (ayuda de programación) o Reddit (foros de discusión), que alimentan las rutinas LLM de IA generativa, han expresado su descontento por el saqueo de sus foros sin compensación financiera. Los sitios de medios como Condé Nast también piden a los desarrolladores de IA generativa que respeten los derechos de autor y negocien los derechos de uso de sus datos. Si las batallas en torno a las licencias de código abierto y el uso de código –como el conflicto legal entre Minio y Nutanix– aún no se resuelven, otro aspecto legal se está abriendo con la IA generativa que requiere grandes masas de datos para alimentar sus modelos y generar una volumen de negocios que promete ser particularmente sustancial.
Otras noticias que te pueden interesar