Para ponerse al día con Nvidia (que ofrece sistemas GPU asociados con Infiniband), Intel Intel Corp. está intensificando sus esfuerzos para llevar sus soluciones de IA a las redes empresariales, centros de datos, servidores y otros dispositivos periféricos. En su evento Intel Vision 2024, el gigante de los chips anunció planes para tarjetas de interfaz de red Ethernet (NIC) basadas en futuras especificaciones del Ultra Ethernet Consortium (UEC), procesadores Xeon 6 de alto rendimiento y el acelerador Gaudi 3, que está orientado a cargas de trabajo de inferencia y entrenamiento de IA, así como a GenAI a gran escala. “Nuestro objetivo final es ofrecer sistemas de IA que abarquen desde API hasta IoT en la industria, desde el borde hasta el centro de datos, y facilitar a las empresas la adopción y el uso efectivos de la IA en general”, dijo Sachin Katti, vicepresidente y gerente general del Network and Edge Group en Intel. Se planea una amplia cartera de chips de conectividad Ethernet de IA y tarjetas de red Ethernet de IA para su integración en XPU, sistemas de aceleración basados ​​en Gaudi y una gama de diseños de interconexión de IA (software y hardware) para Intel Foundry, dijo Katti.

Los sistemas basados ​​en Ethernet cumplirán con los criterios de estructura de red abierta de la UEC, que se espera que se publiquen a finales de este año. Intel es miembro fundador de la UEC, que ahora cuenta con más de 50 proveedores que desarrollan tecnologías para aumentar la escalabilidad, la estabilidad y la confiabilidad de las redes Ethernet para cumplir con los requisitos de redes de alto rendimiento necesarios para la IA. Las especificaciones de la UEC abordarán una variedad de mejoras evolutivas de Ethernet, incluidas mejores opciones de transmisión de paquetes y rutas múltiples, así como capacidades modernas de telemetría y gestión de la congestión.

Esta infografía de Intel resume muy bien las características principales de la arquitectura Gaudi 3 XPU. (Crédito: Intel)

Índice
  1. Competición cara a cara con el acelerador H100 de Nvidia
  2. Se revelan los chips Xeon 6
  3. Los socios habituales de Intel en las filas

Competición cara a cara con el acelerador H100 de Nvidia

Intel ha detallado el chip acelerador de IA Gaudi 3 (fabricado en 5 nm en TSMC), que, según afirma, es un 40 % más eficiente energéticamente en promedio que los chips Nvidia H100 similares. "El acelerador de IA Intel Gaudi 3 impulsará sistemas de IA con hasta decenas de miles de aceleradores conectados a través del estándar Ethernet común", afirmó Intel. Por ejemplo, 24 puertos Ethernet de 200 Gigabit están integrados en cada acelerador Intel Gaudi 3, lo que proporciona una red flexible y estándar de la industria. El acelerador promete ofrecer 4 veces más capacidades de cómputo de IA y 1,5 veces más ancho de banda de memoria que su predecesor, el Gaudi 2, lo que permite un escalamiento eficiente para soportar grandes clústeres de cómputo y eliminar la dependencia de proveedores a través de infraestructuras de red propietarias, dijo Intel. La idea es que el acelerador pueda ofrecer mejoras de rendimiento diez veces mayores para el entrenamiento de IA y los modelos de inferencia, lo que ofrece a las empresas una elección más amplia de sistemas para implementar a medida que avanzan hacia la IA generativa a escala, dijo Katti.

Benjamin Lee, profesor de la Facultad de Ingeniería y Ciencias Aplicadas de la Universidad de Pensilvania, dijo que la trayectoria de Intel no es fácil y que la empresa enfrenta desafíos para seguir siendo competitiva con Nvidia. “Intel ha dominado durante mucho tiempo el diseño y la fabricación de procesadores de alto rendimiento, pero los desafíos recientes reflejan cambios fundamentales en el panorama informático”, dijo el académico. “Los centros de datos seguirán implementando CPU en grandes cantidades para respaldar los servicios de Internet y la computación en la nube, pero cada vez más están implementando GPU para respaldar la IA, e Intel ha tenido dificultades para diseñar GPU competitivas”.

Con su acelerador Gaudi 3, Intel anuncia una mejora media del 50% en la inferencia y una mejora media del 40% en la eficiencia energética en comparación con el Nvidia H100 por una fracción del costo. (Crédito: Intel)

Se revelan los chips Xeon 6

Además del soporte de UEC, Intel anunció un plan (en colaboración con SAP, Red Hat, VMware y otros) para crear una plataforma abierta que acelere la implementación de sistemas de IA generativos seguros para las empresas. La idea es garantizar que cuando las empresas construyan sistemas de IA, tengan conectividad de red abierta y basada en estándares para que puedan implementar modelos de IA a escala de forma segura, dijo Katti.

Intel también presentó los procesadores Xeon 6 (la compañía ha abandonado el nombre de escalable de sexta generación) que ofrecen una mejora de rendimiento 4 veces mayor y una densidad de rack casi 3 veces mejor que los procesadores Intel Xeon de segunda generación, según la compañía. Esta última enfatiza que los chips Xeon 6 brindarán Las empresas tienen la capacidad de respaldar el entrenamiento de IA y funciones como la generación aumentada de recuperación (RAG), que implica recuperar datos de la empresa. Actualizar y hacer más precisos los LLM.

Los socios habituales de Intel en las filas

Gaudi 3 estará disponible para los fabricantes de equipos originales en el segundo trimestre de 2024 en configuraciones estándar de placa base universal y módulo de aceleración abierta (OAM). Dell Technologies, Hewlett Packard Enterprise, Lenovo y Supermicro se encuentran entre los proveedores que integrarán Gaudi 3 en servidores y otros equipos. Se espera que los aceleradores Gaudi 3 estén disponibles para el público en general en el tercer trimestre de 2024. En el caso de Xeon 6, se espera que estén disponibles en el segundo trimestre de 2024.