✨︎ Resumen (TL;DR):
- OpenAI liberó una actualización para ejecutar agentes de IA en entornos aislados.
- Incluye soporte para 7 proveedores y almacenamiento externo en AWS S3 y Google Cloud.
- Separa el control de los permisos, protegiendo credenciales sensibles durante su ejecución.
OpenAI liberó este miércoles una actualización mayor para su Agents SDK que introduce la ejecución nativa en sandbox. Esta herramienta permite a los desarrolladores correr agentes de inteligencia artificial en entornos completamente aislados, otorgándoles sistemas de archivos propios, acceso a la consola de comandos (shell) y montajes de almacenamiento en la nube.
La compañía calificó esta mejora como “la próxima evolución del Agents SDK”, ya que abandona la dependencia exclusiva del contexto del prompt para ofrecer espacios de trabajo estructurados y seguros.
SandboxAgent es una nueva clase del sistema que crea una barrera de ejecución para separar el entorno de orquestación del entorno de cómputo. Al operar dentro de este sandbox, los agentes pueden manipular archivos, instalar dependencias, exponer puertos y retomar tareas sin perder el estado de la sesión.
Almacenamiento externo y control total
Mediante una nueva abstracción llamada Manifest, los desarrolladores logran montar almacenamiento externo directo al entorno desde AWS S3, Google Cloud Storage, Azure Blob Storage y Cloudflare R2.
El SDK integra soporte nativo para siete proveedores de sandbox: Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop y Vercel, además de opciones locales vía Unix y Docker. Las capacidades predeterminadas de estos agentes incluyen:
- Shell: Para la ejecución directa de comandos.
- Filesystem: Edición de archivos mediante la herramienta
apply_patchy análisis de imágenes. - Compaction: Recorte de contexto durante procesos de larga duración.
A nivel de seguridad, OpenAI enfatizó la separación entre el control y el procesamiento. Las credenciales confidenciales permanecen en una infraestructura de confianza, mientras que el sandbox opera con permisos restringidos. Un sistema de instantáneas (snapshots) protege el progreso contra fallas en los contenedores al guardar y restaurar el espacio de trabajo.
El entorno también introduce la memoria de sandbox, una función independiente del historial de chat que guarda el aprendizaje de ejecuciones previas en archivos reutilizables en S3 para futuros agentes.
Por ahora, estos agentes están disponibles exclusivamente en el Python Agents SDK, aunque la versión para TypeScript ya se encuentra en fase de desarrollo junto con futuros modos dedicados para código y patrones de sub-agentes.