IBM Cloud está expandiendo sus servicios tecnológicos de IA con pulgas de Intel Gaudi 3 ahora disponible para empresas. Con los aceleradores Gaudi 3, los clientes pueden probar, implementar y desarrollar modelos y aplicaciones de IA de negocios más rentables, según Big Blue, que sería el primer proveedor de servicios en la nube en adoptar Gaudi 3. Según la empresa de Armonk, estos aceleradores incluyen concepciones específicas y características para la IA y están destinadas al desarrollo de modelos de idiomas grandes (LLM) aumentados en la recuperación (RAG). Los aceleradores tienen motores matemáticos matriciales, corazones de tratamiento de tensoriel, memoria de banda ancha y puertos Ethernet integrados para la inferencia acelerada de redes neuronales profundas, según IBM. "Las empresas pueden pasar de un solo nodo (ocho aceleradores) con un flujo de 9.6 TB/s a un grupo de 1,024 nudos (8,192 aceleradores) para un flujo de 9,830 in/s. La escala se realiza utilizando una opción de muchos interruptores de Ethernet estándar y con alta capacidad y otras infraestructuras de soporte para ayudar a reducir los costos", dijo IBM.

Gaudi 3 se puede implementar a través de servidores virtuales IBM Cloud para instancias virtuales de nube privada (VPC). Las empresas tienen la posibilidad de elegir sus recursos de cálculo, almacenamiento y red de acuerdo con sus necesidades, dijo Big Blue. Además, el paquete se puede proporcionar en forma de un contenedor de nodo, e IBM Cloud dijo que planeaba proporcionar a Gaudi 3 como un nodo de trabajo para Red Hat OpenShift AI y Red Openshift Clusters en IBM Cloud a principios de 2025. Los cuerpos Gaudi 3 también se hacen cargo de las opciones de imágenes de Hat Enterprise de Hat Enterprisu.

La competencia Gaudi 3 Chips H100 y H200 GPU

Para las empresas que necesitan más control sobre su desarrollo de IA, IBM indica que podrán implementar el software Watsonx.AI con el servidor virtual basado en Gaudi 3 en IBM VPC Cloud en el segundo trimestre de 2025. Watsonx.ai incluye un estudio de desarrollo de inicio a finalización, una caja de herramientas para desarrolladores de IA y gestión completa de los servicios de IA Cycle AI de IA Life AI y los expedientes en las aplicaciones de los clientes en las aplicaciones de los clientes. "Si bien la IA está pasando cada vez más por una tendencia experimental a la columna vertebral de las aplicaciones del mundo real, las organizaciones de TI se enfrentan al desafío de equilibrar el rendimiento necesario con las consideraciones económicas de los equipos de IA, a gran escala", escribió Mitch Lewis, analista de rendimiento de Signal65, que ofrece pruebas, validaciones de rendimiento y consejos basados ​​en la industria tecnológica.

“A previous analysis of signal65 has shown that the Gaudi 3 accelerators were able to offer highly competitive performance for IA inference workloads, while offering substantial economic advantages. The availability of Intel Accelerators on IBM Cloud seems to rely on these advantages while providing companies with an approach based on cloud, easily accessible and scalable, for the deployment of AI applications, "wrote Lewis in a Publicación de blog sobre la implementación del Intel Gaudi 3 Acelerator 3 En IBM Cloud. "Estas pruebas de rendimiento preliminares de Signal65 han demostrado que Intel Gaudi 3 ofreció un rendimiento muy competitivo en comparación con otras ofertas basadas en NVIDIA en IBM Cloud. Gaudi 3 en IBM Cloud proporciona una plataforma flexible capaz de lograr un alto rendimiento en diferentes modelos y configuraciones técnicas", escribió Lewis. "Además, el precio de las instancias de Gaudi 3 en IBM Cloud es una ventaja económica interesante en comparación con los dos tipos de instancias de Nvidia", con GPU H100 y H200, que IBM Cloud también es compatible ", dijo Lewis.