IRCNF

Microsoft bringt erstes eigenes Reasoning-Modell – und es schlägt Claude Sonnet 4.6 in Blindtests

Microsoft AI
Teilen:
Microsoft bringt erstes eigenes Reasoning-Modell – und es schlägt Claude Sonnet 4.6 in Blindtests

Microsoft hat auf der Build 2026 am 2. Juni MAI-Thinking-1 angekündigt – das erste eigene Flaggschiff-Reasoning-Modell, das ohne OpenAI-Trainingsdaten entwickelt wurde, und der Auftakt der sogenannten MAI-Modellfamilie. Die Ankündigung markiert einen bedeutenden Wandel: Microsoft war bisher der größte OpenAI-Kunde und -Vertreiber, und jetzt hat das Unternehmen ein eigenes konkurrenzfähiges Reasoning-Modell.

Der Zeitpunkt ist bemerkenswert. MAI-Thinking-1 kommt in einer Phase der Konsolidierung im KI-Modellmarkt, in der leistungsstarke Open-Source-Alternativen die Lücke zu proprietären Frontier-Modellen schließen. Die Entscheidung von Microsoft, ein eigenes Modell zu entwickeln und zu veröffentlichen – statt OpenAI-Modelle einfach weiterzuverkaufen oder zu fine-tunen – spiegelt sowohl die Ökonomie (Besitz des Modells senkt die Kosten pro Inferenz) als auch die strategische Erkenntnis wider, dass die vollständige Abhängigkeit von einem Zulieferer, der auch ein Wettbewerber ist, eine Position ist, die die meisten Unternehmen diversifizieren möchten.

Was die Benchmarks wirklich sagen

MAI-Thinking-1 ist ein Modell mit 35 Milliarden aktiven Parametern und einem 128K-Kontextfenster (256K in manchen Konfigurationen). Microsoft veröffentlichte folgende Benchmark-Ergebnisse:

  • SWE-Bench Pro: 52,8 % – Microsoft gibt an, dass dies mit Claude Opus 4.6 bei Coding-Aufgaben gleichzieht
  • AIME 2025: 97,0 %
  • AIME 2026: 94,5 %
  • LiveCodeBench v6: 87,7 %

Die wichtigste Behauptung – dass unabhängige menschliche Tester in Blindtests MAI-Thinking-1 gegenüber Anthropics Claude Sonnet 4.6 in der Gesamtqualität bei Single- und Multi-Turn-Aufgaben bevorzugten – ist eine Art Benchmark, die genauer betrachtet werden muss. Bewertungen menschlicher Präferenz können je nach Prompt-Auswahl, Testergruppe und Aufgabenstellung sehr unterschiedlich ausfallen. Microsoft hat die vollständige Methodik nicht veröffentlicht. Dennoch: Der SWE-Bench Pro-Score ist ein reproduzierbarer Benchmark, und 52,8 % ist wettbewerbsfähig mit der Spitzengruppe öffentlich verfügbarer Modelle.

Die Angabe „ohne OpenAI-Daten trainiert“ ist sowohl rechtlich als auch technisch bedeutsam. Sie stellt klar, dass MAI-Thinking-1 kein Derivat der GPT-Familie ist und dass Microsofts KI-Fähigkeiten nicht von der OpenAI-Partnerschaft abhängen. Ob diese Unabhängigkeit für die gesamte Modellfamilie oder nur für dieses Release gilt, ist noch nicht bekannt.

Das MRC-Protokoll: Networking für KI in großem Maßstab

Die zweite wichtige Ankündigung der Build, die Beachtung verdient, ist das Multipath Reliable Connection (MRC) Protocol – ein RDMA-basierter Netzwerkstandard, der von OpenAI in Zusammenarbeit mit Microsoft, AMD, Broadcom, Intel und NVIDIA entwickelt wurde.

MRC löst ein spezifisches und folgenreiches Problem: Synchrones KI-Training über Tausende von GPUs erfordert Netzwerke, die die gleichzeitigen All-Reduce-Kommunikationsmuster des Trainings in großem Maßstab mit hoher Zuverlässigkeit und niedriger Latenz bewältigen. Aktuelle KI-Cluster nutzen InfiniBand oder RoCE (RDMA over Converged Ethernet); beide haben Einschränkungen im Umgang mit Überlastung und Hardwareausfällen während des Trainings.

MRC erweitert RoCE um Multipath Packet Spraying – die Verteilung des Datenverkehrs auf viele parallele Pfade statt auf einen einzigen – sowie SRv6 Source Routing, das dem Sender erlaubt, den Paket-Routing durch das Netzwerk explizit zu bestimmen. Zusammen ermöglichen diese Techniken, dass MRC dynamisch um Überlastungen und Hardwareausfälle herumleiten kann, ohne dass der Trainingsjob anhalten oder von einem Checkpoint neu gestartet werden muss.

Entscheidend: MRC ist bereits in Produktion. OpenAI und Microsoft haben es in ihren größten Trainingsclustern eingesetzt, darunter Systeme auf Basis von NVIDIA GB200-Hardware. Die Spezifikation wurde an das Open Compute Project – das Industriekonsortium zur Standardisierung offener Hardware- und Netzwerkdesigns – übergeben, sodass andere Betreiber sie lizenzfrei implementieren können.

Wenn MRC breite Akzeptanz findet, wäre dies der bedeutendste Vorstoß von Ethernet in die KI-Trainingsinfrastruktur – ein Bereich, den InfiniBand auf höchstem Leistungsniveau traditionell dominiert hat. Das Konsortium aus AMD, Broadcom, Intel, NVIDIA, OpenAI und Microsoft hat genug industrielles Gewicht, um von Rechenzentrumsbetreibern ernst genommen zu werden, die Fabrikarchitekturen für neue KI-Cluster evaluieren.

Was Microsofts Modellunabhängigkeit für den Markt bedeutet

Die Partnerschaft zwischen Microsoft und OpenAI war so strukturiert, dass Microsoft OpenAIs Modelle über Azure weiterverkauft und in seine Produkte integriert. MAI-Thinking-1 schafft eine interne Alternative. Microsoft hat nicht gesagt, dass MAI die OpenAI-Vereinbarungen ersetzt – die beiden Unternehmen bleiben eng verbunden – aber ein eigenes proprietäres Modell verschafft Microsoft Verhandlungshebel, reduziert die Abhängigkeit von OpenAIs Preispolitik und erlaubt es, Modell-Serving zu Margen anzubieten, die von den eigenen Rechenkosten abhängen und nicht von OpenAIs API-Preisen.

Für Unternehmenskunden, die derzeit Azure-OpenAI-Endpunkte nutzen, ergibt sich eine praktische Konsequenz: eine neue Option – ein Microsoft-eigenes Modell, das über Microsoft Foundry (derzeit in Private Preview) verfügbar ist und nicht über OpenAIs Infrastruktur läuft. Ob Unternehmen MAI-Thinking-1 für ihre spezifischen Workloads Claude oder GPT-5 vorziehen, wird von unabhängigen Evaluierungen abhängen, die über das von Microsoft Veröffentlichte hinausgehen.

Das Modell ist noch nicht öffentlich verfügbar. Der Zugang erfolgt derzeit über die Private Preview von Microsoft Foundry. Zeitplan und Preise für die allgemeine Verfügbarkeit wurden noch nicht bekannt gegeben.

Quellen: Microsoft AI; Microsoft Blog; Neowin

Originally reported by Microsoft AI. Read the original article for additional details.

View original source
Teilen: