Nvidia presenta sus nuevos superchips Blackwell Ultra GB300 y Vera Rubin
Nvidia ha anunciado que está generando $2,300 en ganancias cada segundo gracias a la revolución de la inteligencia artificial (IA). Su negocio de centros de datos es tan grande que incluso sus hardware de redes ahora genera más dinero que sus GPUs de juegos. En este contexto, la compañía ha presentado sus nuevos chips de IA, el Blackwell Ultra GB300, que se enviará en la segunda mitad de este año, y el Vera Rubin, que llegará a finales del próximo año, junto con el Rubin Ultra, programado para el segundo semestre de 2027.
El Blackwell Ultra de este año no es lo que se había anticipado originalmente. Aunque Nvidia había mencionado anteriormente que comenzaría a lanzar nuevos chips de IA anualmente, la compañía rápidamente pasó de hablar del Blackwell Ultra durante su presentación principal en la GDC para revelar su próxima arquitectura, el Vera Rubin, que promete ofrecer un rendimiento 3.3 veces superior a un rack comparable de Blackwell Ultra.
Nvidia ha tenido cuidado de comunicar con claridad las mejoras en el Blackwell Ultra en comparación con el modelo anterior. Durante una charla previa con periodistas, se mencionó que un único chip Ultra proporcionará el mismo rendimiento de 20 petaflops de IA que el modelo Blackwell, pero ahora cuenta con 288GB de memoria HBM3e en lugar de los 192GB disponibles anteriormente. Además, un clúster Blackwell Ultra DGX GB300 "Superpod" ofrecerá la misma cantidad de 288 CPUs, 576 GPUs y 11.5 exaflops de computación FP4 que su predecesor, pero con 300TB de memoria en vez de 240TB.
Nvidia ha comparado su nuevo Blackwell Ultra con el H100, su chip de 2022 que sentó las bases de su éxito en la IA. Según Nvidia, el Blackwell Ultra puede ofrecer 1.5 veces más rendimiento en inferencia FP4, acelerando significativamente el "razonamiento de IA," capaz de ejecutar una copia interactiva de DeepSeek-R1 671B en solo diez segundos, a diferencia de los 1.5 minutos que tardaba el H100. Esta mejora se debe a que puede procesar 1,000 tokens por segundo, diez veces más que los chips de 2022 de Nvidia.
Además, algunas empresas podrán adquirir un solo chip Blackwell Ultra. Nvidia ha presentado una computadora de escritorio llamada DGX Station que incluye un chip GB300 Blackwell Ultra junto con 784GB de memoria del sistema unificada y una red Nvidia de 800Gbps, manteniendo los prometidos 20 petaflops de rendimiento de IA. Empresas como Asus, Dell y HP se unirán a Boxx, Lambda y Supermicro para ofrecer versiones de este desktop.
La compañía también lanzará un rack conocido como el GB300 NVL72, que ofrecerá 1.1 exaflops de FP4, 20TB de memoria HBM, 40TB de "memoria rápida," con 130TB/sec de ancho de banda NVLink y 14.4 TB/sec de redes.
Sin embargo, el Vera Rubin y Rubin Ultra podrían mejorar drásticamente ese rendimiento cuando lleguen en 2026 y 2027. El Rubin ofrecerá 50 petaflops de FP4, un salto significativo desde los 20 petaflops del Blackwell. Mientras que el Rubin Ultra contará con un chip que combina dos GPUs Rubin, logrando el doble de rendimiento con 100 petaflops de FP4 y casi cuadruplicando la memoria a 1TB.
Un rack completo NVL576 de Rubin Ultra promete proporcionar 15 exaflops de inferencia FP4 y 5 exaflops de entrenamiento FP8, lo que Nvidia afirma que representa un aumento de 14 veces en comparación con el rack Blackwell Ultra que se enviará este año. Puede encontrar otras especificaciones examinando las imágenes a continuación.
Nvidia ha informado que ya ha generado $11 mil millones en ingresos a partir de Blackwell; los cuatro principales compradores han adquirido un total de 1.8 millones de chips Blackwell hasta ahora en 2025. Nvidia está presionando para que sus nuevos chips, así como todos sus chips de IA, sean considerados esenciales para el futuro de la computación. La compañía intenta argumentar que las empresas necesitarán cada vez más potencia de cómputo, desafiando la suposición de que la demanda disminuiría después de que DeepSeek alterara las expectativas de los inversores y provocara la caída del precio de sus acciones. Durante la conferencia de tecnología de GPU de Nvidia, el fundador y CEO Jensen Huang afirmó que la industria necesitará "100 veces más de lo que pensábamos que necesitábamos el año pasado" para mantenerse al día con la demanda.
Por último, Huang mencionó que la próxima arquitectura después de Vera Rubin, que se espera para 2028, llevará el nombre de Feynman, presumiblemente en honor al famoso físico teórico Richard Feynman. Dijo que algunos familiares de la pionera astrónoma Vera Rubin estaban presentes en la audiencia.
tecnología, Nvidia, IA