💡 Resumen (TL;DR):
- Nvidia puso en producción total su plataforma unificada de hardware para dominar el procesamiento de IA agéntica.
- Jensen Huang proyecta que los pedidos de tecnología Blackwell y Vera Rubin alcancen 1 billón de dólares para 2027.
- El sistema reduce los costos de tokens de inferencia hasta 10 veces frente a arquitecturas anteriores.
Nvidia presentó su plataforma Vera Rubin de siete chips durante la conferencia GTC 2026 en San José. El sistema entra en fase de producción total para operar la infraestructura central de la inteligencia artificial agéntica.
Durante el evento, el CEO de la compañía elevó drásticamente sus previsiones financieras. Jensen Huang espera que las órdenes de compra para las tecnologías Blackwell y Vera Rubin sumen 1 billón de dólares para 2027, duplicando los 500,000 millones proyectados originalmente.
La arquitectura creció frente al anuncio preliminar de enero pasado. Ahora incluye el acelerador de inferencia Groq 3 LPU, sumado tras la adquisición de la startup, completando un esquema de hardware que Nvidia denomina “codiseño extremo”.
“Hemos llegado a ese momento de inflexión. La inflexión de la inferencia ha llegado”, dijo Huang durante su presentación principal.
Vera Rubin es un sistema de rack a escala que reduce el costo de los tokens de inferencia hasta 10 veces en comparación con la plataforma Blackwell. El paquete integra el Vera CPU, Rubin GPU, NVLink 6 Switch, ConnectX-9 SuperNIC, BlueField-4 DPU, Spectrum-6 Ethernet switch y el Groq 3 LPU para operar de forma unificada.

El motor del ecosistema: Vera CPU
El núcleo de este lanzamiento es el Vera CPU, un procesador construido con 88 núcleos Arm “Olympus” personalizados y diseñado específicamente para orquestar cargas de trabajo de IA agéntica.
El hardware entrega un rendimiento 50% más rápido y el doble de eficiencia energética que los procesadores tradicionales a escala de rack, soportado por 1.2 TB/s de ancho de banda de memoria vía LPDDR5X.
Dion Harris, jefe de infraestructura de IA en Nvidia, indicó a la cadena de noticias CNBC que los procesadores convencionales se convirtieron en un cuello de botella para escalar operaciones de agentes automatizados, forzando el desarrollo de este sistema integrado.
El despliegue global cuenta con el respaldo de los principales actores del ecosistema cloud y hardware corporativo:
- Hyperscalers: Alibaba, Meta, Oracle Cloud Infrastructure, CoreWeave y Lambda implementarán el Vera CPU.
- Fabricantes (OEMs): Dell, HPE, Lenovo y Supermicro enviarán servidores basados en Rubin.
- Nube Pública: AWS, Google Cloud y Microsoft Azure ofrecerán instancias Vera Rubin en la segunda mitad de 2026.
Nvidia también reveló cinco diseños de rack, destacando el Vera Rubin NVL72 —con 72 GPUs Rubin y 36 CPUs Vera— y un rack independiente refrigerado por líquido para 256 procesadores Vera, capaz de sostener más de 22,500 entornos simultáneos.
Con esta maniobra, el gigante tecnológico diversifica su estrategia de negocio para no depender exclusivamente de las tarjetas gráficas puras. “Nvidia es la primera empresa del mundo integrada verticalmente, pero abierta horizontalmente”, afirmó Huang.
El mercado asimila este hardware como el inicio de una nueva era operativa comercial. Ben Bajarin, analista de Creative Strategies, definió el avance del procesador Vera como “nueva infraestructura: una expansión desde cero de racks de CPU dedicados exclusivamente a ejecutar IA agéntica”.