Microsoft presentó oficialmente MAI-Code-1-Flash, un modelo de inteligencia artificial desarrollado desde cero y optimizado para tareas de programación, que compite directamente con soluciones de Anthropic y OpenAI.
Microsoft anunció el lanzamiento de MAI-Code-1-Flash, su primer modelo de inteligencia artificial desarrollado desde cero y optimizado exclusivamente para la programación. El modelo se integra de forma nativa en GitHub Copilot y estará disponible para desarrolladores individuales a través de Visual Studio Code.
Según informó la compañía, MAI-Code-1-Flash fue diseñado utilizando los flujos de trabajo de GitHub Copilot, a diferencia de otros modelos que son inteligencias artificiales generalistas adaptadas para entender código. El entrenamiento se realizó con datos limpios y bajo licencias adecuadas, evaluando el rendimiento en tareas de ingeniería de software reales, como resolución de dudas sobre repositorios complejos, refactorización de código y tareas automatizadas basadas en telemetría.
El modelo incorpora un sistema de control adaptativo de longitud de solución, que permite autorregular los recursos según la complejidad de la tarea: responde de forma concisa ante tareas sencillas y dedica más tiempo y recursos a problemas complejos que requieran modificar múltiples archivos o planificar una arquitectura. Esta gestión permite resolver desafíos de ingeniería utilizando hasta un 60% menos de tokens en comparación con otros modelos del mercado.
Microsoft comparó a MAI-Code-1-Flash con Claude Haiku 4.5, el modelo ligero de Anthropic, en entornos de producción idénticos utilizando pruebas de referencia como SWE-Bench (Verified, Pro y Multilingual) y Terminal Bench 2. Según los resultados publicados, el modelo de Microsoft superó a Claude en todos los frentes: en SWE-Bench Pro obtuvo un 51,2% de efectividad frente al 35,2% de Anthropic. También superó en seguimiento preciso de instrucciones (IF Bench) con una ventaja de casi 29 puntos, y destacó en áreas como matemáticas y generación de código visual.
Para evaluar su capacidad de razonamiento lógico, Microsoft sometió al modelo a un examen de 186 preguntas con escenarios contradictorios, imposibles o con información faltante. MAI-Code-1-Flash logró un 85,8% de precisión ajustada.
