Mientras que los primeros clientes esperan la entrega de su servidor equipado con aceleradores B200 (Blackwell) de NVIDIA, los medios chinos han elevado el velo en la próxima plataforma GB300 (combinando Grace CPU y Blackwell GPU). En toda la lógica, debe anunciarse oficialmente en el GTC, el evento anual de Nvidia Programado para marzo de 2025 en San José.
El sitio de UDN Han encontrado elementos en el próximo servidor GB300 dedicado a la IA. Estará equipado con el acelerador B300 (Blackwell), respaldado por 288 GB de memoria HBM3E (con solo 192 GB hoy) que va a una arquitectura de 12 capas contra 8 anteriormente. El chip debe hacerse con el mismo proceso de grabado de 4 nm de TSMC utilizado para B100 y B200.
Muy energía deliciosa
Aún así, según los medios de comunicación chinos, el consumo aumenta en 200 vatios con un TDP que pasa a 1,400 vatios para el GB300 y 1,200 vatios para el B300 HGX respectivamente (contra 1,200 W y 1,000 W para el GB200 y el B200). Un consumo que requerirá enfriamiento líquido directo para servidores y trabajar para hiperscalers para optimizar los gabinetes que pueden acomodar este equipo. En la parte de la red, el ancho de banda debería aumentar a 1.6 tbit/s contra 800 Gbit/s evolucionando de ConnectX7 a ConnectX8.
Con estos desarrollos, el rendimiento de precisión FP4 mostrará una ganancia del 50 % en comparación con GB200. Un aumento esperado para las cargas de trabajo de inferencia que requieren un cálculo más rápido, un movimiento de datos reducido y un menor consumo de energía. Todavía hay varias incógnitas en la próxima plataforma GB300 en Nvidia. ¿Cuál será su costo? El sitio UDN subraya que el componente VRM (módulo regulador de voltaje) que administra la tensión para suministrar el SOC presente en los servidores muestra un precio de producción de 20 a 25,000 dólares (un gabinete NVL72 AI incluye 300 o entre 7 y 7.5 millones de dólares). La otra pregunta es la disponibilidad de productos. El B200 y el GB200 aún no han ingresado al pico de producción y Nvidia tuvo que enfrentar retrasos. Puede ser necesario esperar a que la nota clave del CEO de Nvidia Jensen Huang en CES en Las Vegas a principios de enero debutara.
Otras noticias que te pueden interesar