💡 Resumen (TL;DR):
- Dos ingenieros desarrollaron la herramienta en tres meses para automatizar consultas de datos corporativos.
- El sistema opera con GPT-5.2, analiza 600 petabytes de datos y el 70% de su código fue escrito por IA.
- OpenAI no venderá la herramienta, la usará como caso de estudio para que otras empresas construyan las suyas.
OpenAI reveló que un agente de datos interno, desarrollado por apenas dos ingenieros en tres meses, ahora asiste a más de 4,000 empleados de los 5,000 que conforman su plantilla. La compañía presenta este proyecto como un modelo replicable para la adopción de inteligencia artificial a nivel corporativo.
El sistema funciona con GPT-5.2 y rastrea información entre 600 petabytes de datos y 70,000 datasets. Esto permite que el personal de finanzas, producto o ingeniería haga preguntas en lenguaje natural a través de Slack o aplicaciones internas. En cuestión de minutos, los equipos reciben gráficos, paneles de control y análisis detallados.
Según reportes de VentureBeat, OpenAI calcula que la herramienta ahorra entre dos y cuatro horas de trabajo por cada consulta. Como dato técnico, aproximadamente el 70% del código base de este agente fue redactado por otra inteligencia artificial.

El reto de los datos y las 6 capas de contexto
Emma Tang, jefa de infraestructura de datos en OpenAI, explicó que el verdadero impacto del agente es cualitativo. La herramienta permite a los empleados descubrir análisis que nunca habrían intentado con los métodos de trabajo anteriores.
El mayor obstáculo técnico del proyecto fue la fase de descubrimiento: encontrar el dataset correcto entre miles de opciones casi idénticas. Para solucionarlo, integraron seis capas de contexto al sistema:
- Metadatos de esquemas de datos.
- Patrones históricos de consulta.
- Descripciones curadas por expertos humanos.
- Definiciones a nivel de código extraídas por Codex.
- Conocimiento institucional recuperado desde Slack, Notion y Google Docs.
- Memoria de aprendizaje continuo que guarda correcciones previas.
“Tenemos muchas tablas que son bastante similares, y paso muchísimo tiempo tratando de descubrir cómo son diferentes y cuál usar”, señaló un usuario interno en el blog de la compañía. El agente soluciona esto rastreando el código de OpenAI para entender cómo se construyó realmente cada bloque de datos, superando las limitaciones de los metadatos tradicionales.
Un modelo para el sector empresarial
OpenAI confirmó que no planea vender esta herramienta directamente. En su lugar, la empresa usa el proyecto para demostrar que cualquier organización puede construir un sistema similar usando sus APIs públicas, incluyendo Codex, GPT-5, Evals y Embeddings.
Esta revelación llega mientras OpenAI expande su oferta corporativa, tras el lanzamiento de su plataforma Frontier en febrero para ayudar a las organizaciones a implementar agentes de IA a gran escala.
Finalmente, Tang subrayó que la gobernanza de datos es el requisito principal para el éxito de estos sistemas. Sin información limpia y bien etiquetada, los agentes corporativos no pueden encontrar ni confiar en los datos correctos.