Microsoft dévoile son premier modèle de raisonnement maison – et il surpasse Claude Sonnet 4.6 en tests en aveugle | IRCNF - Intelligent Reliable Custom Next-gen Frameworks

Microsoft a dévoilé MAI-Thinking-1 lors du Build 2026 le 2 juin — son premier modèle de raisonnement phare développé en interne, sans données d'entraînement OpenAI, et le premier mouvement de ce qu'elle appelle sa famille de modèles MAI. L'annonce marque un tournant significatif : alors que Microsoft était le plus grand client et distributeur d'OpenAI, il dispose désormais d'un modèle de raisonnement compétitif qui lui est propre.

Le timing est notable. MAI-Thinking-1 arrive alors que le marché des modèles d'IA se resserre, avec des alternatives open-source solides qui réduisent l'écart avec les modèles propriétaires de pointe. La décision de Microsoft de construire et de publier son propre modèle — plutôt que de simplement revendre ou d'effectuer un fine-tuning du modèle d'OpenAI — reflète à la fois l'économie (posséder le modèle réduit les coûts par inférence) et la réalité stratégique que dépendre entièrement d'un fournisseur qui est aussi un concurrent est une position que la plupart des entreprises cherchent à diversifier.

Ce que les benchmarks disent vraiment

MAI-Thinking-1 est un modèle de 35 milliards de paramètres actifs avec une fenêtre de contexte de 128K (256K dans certaines configurations). Microsoft a publié les résultats de benchmark suivants :

SWE-Bench Pro : 52,8 % — Microsoft affirme que cela correspond à Claude Opus 4.6 sur les tâches de codage
AIME 2025 : 97,0 %
AIME 2026 : 94,5 %
LiveCodeBench v6 : 87,7 %

L'affirmation principale — que des évaluateurs humains indépendants en tests en aveugle ont préféré MAI-Thinking-1 au Claude Sonnet 4.6 d'Anthropic pour la qualité globale dans des tâches à un ou plusieurs tours — est le type de benchmark qui mérite un examen attentif. Les « évaluations de préférence humaine » peuvent varier considérablement selon la sélection des prompts, le panel d'évaluateurs et le cadrage des tâches. Microsoft n'a pas publié la méthodologie complète. Cela dit, le score SWE-Bench Pro est un benchmark concret et reproductible, et 52,8 % est compétitif avec le haut du panier des modèles disponibles publiquement.

La mention « entraîné sans données OpenAI » est significative à la fois sur le plan légal et technique. Elle établit que MAI-Thinking-1 n'est pas un dérivé des modèles de la famille GPT et que les capacités d'IA de Microsoft ne dépendent pas de son partenariat avec OpenAI. On ne sait pas encore si cette indépendance s'étend à toute la famille de modèles ou seulement à cette version.

Le protocole MRC : la mise en réseau pour l'IA à grande échelle

La deuxième annonce majeure du Build qui mérite attention est le protocole Multipath Reliable Connection (MRC) — un standard de réseau basé sur RDMA développé par OpenAI en collaboration avec Microsoft, AMD, Broadcom, Intel et NVIDIA.

MRC est conçu pour résoudre un problème spécifique et important : exécuter des tâches d'entraînement synchrone d'IA sur des milliers de GPU nécessite un réseau capable de gérer les schémas de communication all-reduce simultanés d'un entraînement à grande échelle avec une haute fiabilité et une faible latence. Les clusters IA actuels utilisent InfiniBand ou RoCE (RDMA over Converged Ethernet) ; les deux ont des limitations dans la gestion de la congestion et des pannes matérielles pendant les runs d'entraînement.

MRC étend RoCE avec le multipath packet spraying — distribution du trafic sur plusieurs chemins simultanés plutôt qu'un seul — et le routage source SRv6, qui permet à l'émetteur de spécifier explicitement le routage des paquets à travers le réseau. Combinées, ces fonctionnalités permettent à MRC de contourner dynamiquement la congestion et les pannes matérielles, sans que la tâche d'entraînement ne s'arrête ou doive redémarrer à partir d'un checkpoint.

MRC est déjà en production. OpenAI et Microsoft l'ont déployé sur leurs plus grands clusters d'entraînement, y compris les systèmes basés sur le matériel NVIDIA GB200. La spécification a été publiée via l'Open Compute Project — le consortium industriel qui standardise les conceptions matérielles et réseau ouvertes — la rendant disponible pour d'autres opérateurs sans frais de licence.

Si MRC atteint une large adoption, cela représente l'expansion la plus significative d'Ethernet dans l'infrastructure d'entraînement IA, un domaine historiquement dominé par InfiniBand au plus haut niveau de performance. Le consortium de soutien — AMD, Broadcom, Intel, NVIDIA, OpenAI, Microsoft — lui donne suffisamment de poids industriel pour être pris au sérieux par les opérateurs de centres de données qui évaluent les architectures de réseau pour de nouveaux clusters IA.

Ce que l'indépendance de modèle de Microsoft signifie pour le marché

Le partenariat entre Microsoft et OpenAI a été structuré de sorte que Microsoft revende les modèles d'OpenAI via Azure et les intègre dans ses produits. MAI-Thinking-1 crée une option interne alternative. Microsoft n'a pas dit que MAI remplace ses accords avec OpenAI — les deux entreprises restent étroitement liées — mais posséder un modèle propriétaire donne à Microsoft un levier de négociation, réduit son exposition aux décisions de tarification d'OpenAI et lui permet d'offrir un service de modèles à des marges qui dépendent de ses propres coûts de calcul plutôt que des tarifs API d'OpenAI.

Pour les clients entreprise qui utilisent actuellement les endpoints Azure OpenAI, l'implication pratique est une nouvelle option : un modèle natif Microsoft disponible via Microsoft Foundry (actuellement en prévisualisation privée) qui ne nécessite pas de passer par l'infrastructure d'OpenAI. Reste à savoir si les entreprises préféreront MAI-Thinking-1 à Claude ou GPT-5 pour leurs charges de travail spécifiques ; cela dépendra d'évaluations indépendantes au-delà de ce que Microsoft a publié.

Le modèle n'est pas encore disponible publiquement. L'accès en prévisualisation privée de Microsoft Foundry est le point d'entrée actuel. Le calendrier de disponibilité générale et les tarifs n'ont pas été annoncés.

Sources : Microsoft AI ; Microsoft Blog ; Neowin