Con su chip Instinct, que sería capaz de hacer el trabajo de varias GPU, AMD desafía a Nvidia en el campo de la inteligencia artificial. El pasado martes, en un evento en San Francisco donde presentó el chip, la CEO de AMD declaró que el Instinct MI300X era "lo más complejo que AMD haya construido jamás". Del tamaño de una montaña rusa, el Instinct MI300X cuenta con 146 mil millones de transistores y memoria HBM3 de gran ancho de banda compartida por la CPU y la GPU de hasta 192 GB, para un total de 13 chiplets. El chip también tiene un ancho de banda de memoria de 5,2 TB/s, lo que significa que es un 60% más rápido que el H100 de Nvidia. El Instinct MI300X consta de varios núcleos de CPU Zen y una GPU CDNA 3.
Pero la enorme cantidad de memoria es el verdadero punto de venta, según Su. “Lo que vemos a menudo en la industria hoy en día es que los tamaños de los modelos son cada vez más grandes y se necesitan múltiples GPU para ejecutar los últimos modelos de lenguajes grandes”, dijo. . “Con el chip MI300X, podemos reducir la cantidad de GPU y, a medida que el tamaño de los modelos siga creciendo, este criterio será aún más importante. Ofrece más memoria, más ancho de banda de memoria y se necesitan menos GPU”. Según AMD, debido a su diseño, el chip MI300X es 8 veces más potente que el chip MI250X que equipa la Frontier (la supercomputadora más rápida del mundo) y 5 veces más eficiente energéticamente. Equipará al sistema El Capitán con más de dos exaFLOP que se construirán el próximo año en los Laboratorios Nacionales Lawrence Livermore.
Computación abierta admitida
Durante el mismo evento, la Sra. Su también presentó la plataforma Instinct. Este diseño de referencia de servidor basado en las especificaciones de Open Compute Project utiliza 8 GPU MI300X para cargas de trabajo de inferencia y entrenamiento de IA generativa. Esto significa que las empresas y los hiperescaladores pueden utilizar la plataforma Instinct para integrar las GPU MI300X en los bastidores de servidores OCP existentes. "Realmente estamos acelerando el tiempo de comercialización de los clientes y reduciendo los costos generales de desarrollo, al mismo tiempo que facilitamos la implementación de MI300X en su rampa de IA y construcción de servidor existentes", dijo el CEO de AMD.
Una CPU diseñada para la nube
AMD también presentó su procesador EPYC 97X4 de cuarta generación, cuyo nombre en código es Bergamo, especialmente diseñado para entornos de nube, debido a sus numerosos núcleos para ejecutar máquinas virtuales. Bergamo tiene 128 núcleos con hyperthreading, por lo que un sistema de dos sockets puede tener un máximo de 256 CPU virtuales. Su explicó que las cargas de trabajo nativas de la nube "nacieron en la nube". Están diseñados para aprovechar al máximo los últimos marcos de nube y, esencialmente, funcionan como microservicios. El diseño de estos procesadores es diferente al de la TI tradicional: los procesadores Bergamo son más pequeños y están muy orientados al rendimiento, de ahí el diseño multinúcleo. “Bérgamo aprovecha toda la infraestructura de plataforma ya desarrollada para Génova. Admite la misma memoria de próxima generación y capacidades de E/S. Pero permite, gracias a este punto de diseño, obtener un rendimiento superior al de los procesadores tradicionales. Sobre todo, permite, con este punto de diseño, pasar a 128 núcleos por socket para lograr el máximo rendimiento y eficiencia energética en la nube”, explicó también la Sra. Su. Las muestras del MI300X y Bergamo estarán disponibles en el tercer trimestre de este año.
Otras noticias que te pueden interesar