✨︎ Resumen (TL;DR):
- Nvidia inició la entrega física de sus CPUs Vera, sus primeros procesadores personalizados para centros de datos.
- El chip ofrece 1.2 TB/s de ancho de banda de memoria, triplicando el rendimiento por núcleo de Intel y AMD.
- Las unidades llegaron a manos de OpenAI, Anthropic y SpaceXAI para acelerar el desarrollo de agentes de IA.
Nvidia entregó oficialmente sus primeros CPUs Vera a los líderes de la industria de inteligencia artificial. Ian Buck, vicepresidente de cómputo de alto rendimiento de la firma, acudió personalmente a las oficinas de OpenAI, Anthropic y SpaceXAI para suministrar el hardware que busca desbancar a Intel y AMD en el mercado de servidores especializados.
El despliegue comenzó el sábado 16 de mayo con entregas en San Francisco, Mission Bay y Palo Alto. Elon Musk recibió personalmente el procesador para SpaceXAI, la división formada tras la absorción de xAI por parte de SpaceX. Por su parte, Oracle Cloud Infrastructure recibió sus unidades el lunes y planea desplegar cientos de miles de estos CPUs durante 2026.

Un procesador diseñado para no detener al GPU
El CPU Vera es una pieza fundamental de la arquitectura Rubin de Nvidia. A diferencia de soluciones anteriores, utiliza una arquitectura personalizada Arm v9.2 con 88 núcleos Olympus y tecnología Spatial Multithreading, permitiendo un total de 176 hilos de ejecución.
Según la documentación de Nvidia, el chip destaca por las siguientes especificaciones:
- Ancho de banda de memoria: 1.2 TB/s mediante una interfaz LPDDR5X de 1024 bits.
- Rendimiento: Hasta un 50% más rápido en entornos de pruebas (sandboxes) comparado con la competencia.
- Eficiencia de costos: La plataforma Rubin promete reducir el costo de los tokens de inferencia a una décima parte de lo que cuesta con Blackwell.
“Vera es el primer CPU personalizado de NVIDIA, diseñado específicamente para la era de la IA de agentes”, declaró la compañía en su comunicado oficial. El objetivo principal es eliminar los cuellos de botella en el entrenamiento de modelos de lenguaje.
Ian Buck explicó durante el evento GTC 2026 que el mercado exige un CPU capaz de generar grandes volúmenes de datos de entrenamiento en tiempo real. “Lo que el mundo necesita es un CPU realmente rápido que nunca permita que el GPU se quede inactivo”, señaló el directivo.
Este movimiento posiciona a Nvidia como un proveedor de infraestructura de full-stack, compitiendo directamente con el hardware de propósito general. Se espera que la producción masiva comience en la segunda mitad de 2026, con proveedores como CoreWeave listos para implementar racks de servidores NVL72 que integran 72 GPUs vinculados por NVLink 6.
