✨︎ Resumen (TL;DR):
- Microsoft lanzó Critique, una función para Copilot que cruza el trabajo de GPT y Claude para auditar respuestas mutuas.
- El sistema multicomercial logró una mejora de 13.8% en el benchmark DRACO frente a modelos de IA individuales.
- La estrategia busca erradicar las alucinaciones y acelerar la adopción entre sus 450 millones de usuarios comerciales.
Microsoft anunció Critique, una nueva función para Microsoft 365 Copilot Researcher que combina los modelos de OpenAI y Anthropic para reducir los errores generados por inteligencia artificial. Critique es un sistema de validación cruzada que utiliza a GPT para redactar respuestas a consultas de investigación y a Claude para auditar su precisión y fuentes antes de entregarlas al usuario.
La iniciativa forma parte de una estrategia que la compañía denomina “inteligencia multimodal”. En lugar de depender de un solo algoritmo, enfrentan sistemas rivales para mantener la veracidad de la información corporativa.
“GPT redacta, Claude revisa la precisión, la exhaustividad y la integridad de las citas antes de que se entregue”, explicó Jared Spataro, director de marketing de la división AI at Work de Microsoft. La empresa espera que este flujo de trabajo funcione en ambas direcciones próximamente, con Claude redactando y GPT criticando.

Rendimiento superior frente a IA solitaria
Las evaluaciones internas demuestran que este método conjunto supera a las herramientas de investigación profunda de OpenAI, Google, Perplexity y la propia Anthropic. El sistema alcanzó una mejora del 13.8% en DRACO, un benchmark industrial que evalúa la calidad de la investigación.
El ecosistema de Copilot también sumó nuevas capacidades operativas: * Modo Council: Permite comparaciones directas de respuestas entre múltiples modelos lado a lado. * Copilot Cowork: Una herramienta basada en la tecnología de Anthropic para delegar tareas largas y de múltiples pasos dentro de Microsoft 365. Actualmente disponible en el programa de acceso anticipado Frontier para el nivel E7.
Esta integración representa un cambio notable para la tecnológica, que invirtió $13 mil millones de dólares en OpenAI. Ahora, Claude opera directamente en el chat principal de Copilot junto a los modelos de sus competidores.
El movimiento ataca directamente el mayor obstáculo para el uso empresarial de la IA: la falta de fiabilidad. Durante su reporte financiero del 28 de enero, el CEO Satya Nadella confirmó que Copilot alcanzó 15 millones de cuentas pagadas. Aunque la cifra representa un crecimiento interanual del 160%, apenas significa el 3.3% de sus 450 millones de suscriptores. Eliminar los errores con escrutinio cruzado es el paso necesario para convencer al resto del mercado corporativo.
