Con DGX Cloud, Nvidia acelera el entrenamiento generativo de IA
hace 2 años
Con motivo de la última conferencia GTC 2023, Nvidia anunció su última oferta DGX Cloud, que ya está atrayendo la atención de Google Cloud, Microsoft y Oracle. El proveedor también está presionando a AI Foundations para ayudar a las empresas con sus proyectos de IA generativa.
Nvidia está trabajando a toda máquina para su conferencia de desarrolladores GTC 2023 (del 20 al 23 de marzo). Junto con estos últimos sistemas DGX H100 con ocho GPU H100, el proveedor estadounidense presentó su oferta de infraestructura como servicio, DGX Cloud, en la que se ejecutará su último software AI Foundations.
DGX es el nombre de las ofertas para computación de alto rendimiento (HPC) e IA, uno de cuyos primeros modelos se entregó en 2016 a Open AI, desarrollador de la emblemática aplicación de IA generativa ChatGPT. La mitad de todas las empresas de Fortune 100 ahora tienen sus propias soluciones DGX, según el proveedor. AWS, Google Cloud, Microsoft y Oracle también han mostrado gran interés en ofrecer acceso a las GPU H100 sobre las que se construye la DGX. En unos meses, las empresas que no quieran comprar su sistema DGX tendrán la opción de alquilar clústeres de GPU H100 mensualmente a través del servicio DGX Cloud, alojado por los socios hiperescaladores de Nvidia. Este es el caso de Oracle que puede soportar miles de instancias OCI Compute Bare Metal con decenas de miles de GPU Nvidia A100 para procesar aplicaciones masivamente paralelas. "Las redes OCI Supercluster ahora pueden escalar hasta 4096 instancias OCI Compute Bare Metal con 32 768 GPU A100", dijo Karan Batta, vicepresidente de productos de Oracle. "OCI planea ofrecer instancias Compute Bare Metal con GPU Nvidia H100 a finales de este año". Por su parte, Azure planea alojar DGX Cloud el próximo trimestre. Google Cloud se compromete a hacerlo pronto.
El tren de la IA generativa está en marcha
Es probable que los CIO ya utilicen hardware, software y servicios de Nvidia para admitir aplicaciones habilitadas para IA en su empresa. Pero es posible que necesiten profundizar su uso en esta área y el proveedor espera que continúen haciéndolo con su ayuda, incluso si tiene un costo. "Los servicios y soluciones de IA pueden ser costosos, lo que puede generar compensaciones para las empresas con respecto al rendimiento que varía entre los diferentes proveedores en el mercado", dijo Shane Rau, vicepresidente de investigación de semiconductores de IDC.
A medida que el carro de la IA generativa se acelera, Nvidia también promete herramientas para respaldar esta velocidad. Su CEO, Jensen Huang, explicó la llegada de una serie de nuevos servicios para que las empresas capaciten y ejecuten sus propios modelos de IA generativa. “Cuando lleguen al mercado, abrirán más opciones en el continuo de construir vs comprar para los CIO llamados a respaldar las cargas de trabajo de capacitación de IA. Eso no significa que simplemente puedan delegar la responsabilidad de la infraestructura de IA”, dijo Shane Rau, vicepresidente de investigación que cubre chips de procesamiento de datos para IDC. "Los CIO ya deberían entender que la IA no es igual para todos", dijo. “La pila de soluciones de IA varía según cómo se utilice, lo que significa tener una comprensión profunda del caso de uso de IA: los equipos detrás del tema y el dominio en el que están trabajando, y cómo mapear los requisitos de recursos. chips, software, hardware de sistemas y servicios".
Tres servicios en el corazón de IA Foundations
Nvidia ofrece soluciones como servicio para abordar estos problemas en múltiples niveles. Con AI Foundations en particular, que es una familia de servicios en la nube con la que las empresas podrán crear sus propios modelos de lenguaje grande (LLM), una rama de la IA generativa, y ejecutarlos a escala, llamándolos desde las API de Nvidia. Se ofrecen tres servicios en el lanzamiento, aún en acceso limitado o en vista previa privada por el momento: NeMo para generación de texto, Picasso para imágenes y BioNeMo para estructuras moleculares. Cada una de las tres ofertas incluirá modelos preentrenados, marcos de procesamiento de datos, bases de datos de personalización, motores de inferencia y API a las que las empresas pueden acceder desde un navegador, explicó Nvidia.
NeMo, el servicio basado en texto, incluye una variedad de modelos de IA preentrenados que los usuarios pueden seguir entrenando con sus propios datos para personalizarlos con conocimientos específicos del dominio. El proveedor de datos financieros Morningstar ya está explorando cómo puede usar NeMo para extraer datos de mercado útiles a partir de datos sin procesar, confiando en la experiencia de sus empleados para ajustar los modelos. El servicio de Picasso permitirá a las empresas entrenar modelos para generar imágenes, videos e incluso modelos 3D personalizados en la nube. Nvidia se está asociando con Adobe para llevar tales capacidades generativas a sus herramientas para profesionales creativos como Photoshop y After Effects.
¿Lavado de derechos de autor?
Nvidia busca borrar la reputación de la IA generativa (especialmente en la creación artística) que ha tendido a tomarse varias libertades en cuanto a los derechos de autor de los artistas y fotógrafos sobre cuyas obras se entrenan los modelos. Algunos temen que el uso de dichos modelos para crear obras derivadas podría exponer a las empresas a demandas por infracción de derechos de autor. Nvidia espera disipar estas preocupaciones mediante la celebración de un acuerdo de licencia con la biblioteca de imágenes Getty Images, que indica que pagará regalías a los artistas a partir de los ingresos generados por los modelos capacitados en las obras de su base de datos. Nvidia está trabajando con otra biblioteca, Shutterstock, para entrenar a Picasso en la creación de modelos 3D en respuesta a indicaciones de texto basadas en imágenes con licencia en su base de datos. Estos diseños 3D estarán disponibles para su uso en gemelos digitales industriales que se ejecutan en la plataforma Omniverse de Nvidia.
El tercer servicio de AI Foundations, BioNeMo, no se ocupa de palabras e imágenes, sino de estructuras moleculares. Los investigadores pueden usarlo para diseñar nuevas moléculas y predecir su comportamiento. El proveedor lo dirige a las compañías farmacéuticas para el descubrimiento y prueba de fármacos, ajustándolo con datos patentados. La empresa biotecnológica Amgen es una de las primeras usuarias de este servicio.
Si quieres conocer otros artículos parecidos a Con DGX Cloud, Nvidia acelera el entrenamiento generativo de IA puedes visitar la categoría Otros.
Otras noticias que te pueden interesar