🧠 Modelos & Herramientas IA

Microsoft lanza siete modelos MAI propios y declara su independencia del ecosistema OpenAI

MAI-Thinking-1, MAI-Code, MAI-Image-2.5, MAI-Voice-2 y MAI-Transcribe-1.5 marcan el inicio de una nueva era de IA soberana en Microsoft, con capacidades multimodales de nivel frontier.

✍️ Administrador 📅 14 de June de 2026 ⏱ 3 min de lectura 👁 4 visitas

Siete modelos MAI de Microsoft con redes neuronales y luces azules cinematográficas

Microsoft lanza siete modelos MAI propios y declara su independencia del ecosistema OpenAI

MAI-Thinking-1, MAI-Code, MAI-Image-2.5, MAI-Voice-2 y MAI-Transcribe-1.5 marcan el inicio de una nueva era de IA soberana en Microsoft

Durante el evento Microsoft Build 2026, la compañía presentó una familia completa de siete modelos de inteligencia artificial desarrollados íntegramente por su equipo interno MAI Superintelligence, liderado por el CEO de Microsoft AI, Mustafa Suleyman. La presentación supone el paso más ambicioso de Microsoft para reducir su dependencia histórica de OpenAI y competir directamente con los modelos frontier de Anthropic, Google y Meta.

Los siete modelos que lo cambian todo

La familia MAI cubre cinco modalidades clave: razonamiento, código, imagen, transcripción y voz. Cada modelo fue entrenado desde cero con datos limpios y con licencia adecuada, evitando deliberadamente el uso de contenido generado por IA para prevenir la degradación progresiva del modelo.

MAI-Thinking-1: Primer modelo de razonamiento propio de Microsoft. Con 35.000 millones de parámetros activos en arquitectura MoE y una ventana de contexto de 256.000 tokens, iguala a Claude Opus 4.6 en tareas de codificación según el benchmark SWE Bench Pro. Disponible en vista previa privada en Microsoft Foundry.
MAI-Code: Especializado en generación, depuración y análisis de código. Posicionado como alternativa directa a GitHub Copilot en entornos que requieren mayor control.
MAI-Image-2.5 y su variante Flash: Líder en el ranking Arena de edición de imágenes con una puntuación de 1403, superando a Gemini 3 Pro. Ofrece generación y edición de imagen con comprensión de instrucciones significativamente mejorada.
MAI-Voice-2: Síntesis de voz con prosodia natural, control emocional preciso y soporte para 15 idiomas. Complementado por MAI-Voice-2-Flash, optimizado para agentes de voz con latencia ultrabaja.
MAI-Transcribe-1.5: Transcripción de voz a texto en los 25 idiomas más utilizados según el benchmark FLEURS, con una velocidad 2,5 veces superior a la oferta anterior de Azure.

La visión de Suleyman: una máquina de escalar

Mustafa Suleiman describió el proyecto como la construcción de una "hill-climbing machine", un sistema organizativo diseñado para mejorar ciclo tras ciclo a medida que escala la capacidad de cómputo. Según Microsoft, el cómputo utilizado para entrenar modelos frontier ha crecido un billón de veces, y se espera otro incremento de mil veces en los próximos tres años.

"Esta es una nueva era para todos nosotros. Una era de IA que tú controlas en tus propios términos."

— Mustafa Suleiman, CEO de Microsoft AI

Frontier Tuning y la alianza con Mayo Clinic

Junto a los modelos, Microsoft anunció Frontier Tuning, una capacidad que permite a las organizaciones co-crear versiones personalizadas de los modelos MAI usando sus propios datos, conservando la propiedad intelectual. El caso más destacado es la colaboración con Mayo Clinic para desarrollar un modelo frontier específico para el sector sanitario, que se desplegará primero en los hospitales de Mayo Clinic antes de estar disponible para terceros en Azure Foundry.

Todos los modelos están disponibles a través de Microsoft Foundry y el MAI Playground, con opciones de despliegue en la nube Azure, en dispositivos Windows y con certificaciones de cumplimiento empresarial.

¿Qué significa esto para el mercado?

Microsoft ha pasado de ser un revendedor de capacidad de OpenAI a convertirse en un competidor activo en el desarrollo de modelos frontier. Para los equipos de desarrollo nativos en Azure, los modelos MAI ofrecen gobernanza, residencia de datos y reducción de dependencia de terceros como ventajas estratégicas. La elección entre MAI, GPT-4o, Claude o Gemini ya no es binaria: diferentes tareas dentro de un mismo flujo de trabajo pueden tener modelos óptimos distintos.