AbiertoAI nunca deja de sorprender. Su último avance se refiere a la tercera versión de DALL-E construida de forma nativa en ChatGPT. Aquí los usuarios pueden confiar en el chatbot "como socio en la reflexión y el perfeccionamiento de las indicaciones". Para que conste, la primera versión de DALL-E se lanzó en enero de 2021, seguida de una segunda en abril de 2022. Poco más de un año después de esta, OpenAI demuestra que la conversión de texto e imagen se puede perfeccionar. La compañía informa que "los sistemas modernos de conversión de texto a imagen tienden a ignorar palabras o descripciones, lo que obliga a los usuarios a aprender ingeniería rápidamente". Esta última versión representa un paso adelante en nuestra capacidad de generar imágenes que se adhieran exactamente al texto que usted proporciona. Incluso con el mismo mensaje, DALL-E 3 ofrece mejoras significativas sobre DALL-E 2” con “más matices y detalles que sus sistemas anteriores”.
Hay una clara mejora entre las dos versiones de DALL-E. (Crédito: OpenAI)
ChatGPT resultará extremadamente relevante cuando una imagen generada por DALL-E 3 no sea ideal. Para modificarlo y acercarnos lo más posible a la idea que el usuario tiene de él, basta con pedirle a ChatGPT que lo modifique en unas pocas palabras. Actualmente, DALL-E 3 se encuentra en la fase de vista previa de investigación y estará disponible para los clientes de ChatGPT Plus y Enterprise en octubre, a través de la API y en laboratorios más adelante este otoño. OpenAI aclara que "al igual que con DALL-E 2, las imágenes que crea con DALL-E 3 le pertenecen y no necesita nuestro permiso para reimprimirlas, venderlas o comercializarlas".
Un enfoque en la seguridad para evitar cualquier crítica.
La empresa también quiere dar tranquilidad en materia de seguridad. "Al igual que las versiones anteriores, hemos tomado medidas para limitar la capacidad de DALL-E 3 de generar contenido violento, para adultos u odioso". Se ha mejorado el desempeño en materia de seguridad, incluso en áreas de riesgo como la generación de personalidad pública y los sesgos dañinos relacionados con la representación excesiva o insuficiente visual, en asociación con los miembros de su Red Team (presentados por OpenAI como expertos en el dominio que prueban el modelo). Estos vienen como refuerzos para ayudar a informar los esfuerzos de mitigación y evaluación de riesgos en las áreas de propaganda y desinformación, agrega la compañía.
Al mismo tiempo, se llevaron a cabo pruebas internas para detectar mejor las imágenes creadas mediante inteligencia artificial. “Estamos experimentando con un clasificador de procedencia (una nueva herramienta interna que puede ayudarnos a identificar si DALL-E 3 generó o no una imagen) y esperamos utilizar esta herramienta para comprender mejor las formas en que se podrían utilizar las imágenes generadas. ". OpenAI indica que pronto habrá más detalles sobre el tema. Finalmente, señalemos que esta tercera versión está diseñada para responder a solicitudes que solicitan una imagen a la manera de un artista vivo. Los creadores ahora también pueden eliminar sus imágenes del entrenamiento de sus futuros modelos de generación de imágenes.
Las imágenes generadas con DALL-E 3 demuestran que la creatividad ya no tiene límites gracias a una herramienta de este tipo. (Crédito: OpenAI)
Otras noticias que te pueden interesar