IRCNF

Microsoft lança seu primeiro modelo de raciocínio próprio — e supera Claude Sonnet 4.6 em testes cegos

Microsoft AI
Compartilhar:
Microsoft lança seu primeiro modelo de raciocínio próprio — e supera Claude Sonnet 4.6 em testes cegos

A Microsoft anunciou o MAI-Thinking-1 no Build 2026 em 2 de junho — seu primeiro modelo de raciocínio próprio de alto nível, construído sem dados de treinamento da OpenAI, e o movimento inicial do que a empresa chama de sua família de modelos MAI. O anúncio marca uma mudança significativa: a Microsoft tem sido a maior cliente e distribuidora da OpenAI no mundo, e agora possui um modelo de raciocínio competitivo próprio.

O momento é notável. O MAI-Thinking-1 chega em um momento de compressão no mercado de modelos de IA, com alternativas Open Source fortes reduzindo a distância para os modelos proprietários de fronteira. A decisão da Microsoft de construir e lançar seu próprio modelo — em vez de simplesmente revender ou fazer Fine-tuning do modelo da OpenAI — reflete tanto a economia (possuir o modelo reduz os custos por inferência) quanto a realidade estratégica de que depender totalmente de um fornecedor que também é concorrente é uma posição que a maioria das empresas quer diversificar.

O que os Benchmarks realmente dizem

O MAI-Thinking-1 é um modelo com 35 bilhões de parâmetros ativos e janela de contexto de 128K (256K em algumas configurações). A Microsoft publicou os seguintes resultados de Benchmark:

  • SWE-Bench Pro: 52,8% — A Microsoft afirma que isso equivale ao Claude Opus 4.6 em tarefas de codificação
  • AIME 2025: 97,0%
  • AIME 2026: 94,5%
  • LiveCodeBench v6: 87,7%

A afirmação principal — de que avaliadores humanos independentes em testes cegos preferiram o MAI-Thinking-1 ao Claude Sonnet 4.6 da Anthropic em qualidade geral em tarefas de turno único e múltiplos turnos — é o tipo de Benchmark que exige escrutínio. "Avaliações de preferência humana" podem variar substancialmente com base na seleção de Prompt, no grupo de avaliadores e na estruturação das tarefas. A Microsoft não publicou a metodologia completa. Dito isso, a pontuação no SWE-Bench Pro é um Benchmark concreto e reproduzível, e 52,8% é competitivo com o topo dos modelos disponíveis publicamente.

A especificação "treinado sem dados da OpenAI" é significativa tanto legal quanto tecnicamente. Ela estabelece que o MAI-Thinking-1 não é derivado de modelos da família GPT e que as capacidades de IA da Microsoft não dependem de sua parceria com a OpenAI. Ainda não está claro se essa independência se estende a toda a família de modelos ou apenas a este lançamento.

O protocolo MRC: rede para IA em escala

O segundo grande anúncio do Build que merece atenção é o protocolo Multipath Reliable Connection (MRC) — um padrão de rede baseado em RDMA desenvolvido pela OpenAI em colaboração com Microsoft, AMD, Broadcom, Intel e NVIDIA.

O MRC foi projetado para resolver um problema específico e consequente: executar jobs de treinamento síncrono de IA em milhares de GPUs requer uma rede que possa lidar com os padrões de comunicação all-reduce simultâneos do treinamento em larga escala com alta confiabilidade e baixa latência. Os clusters de IA atuais usam InfiniBand ou RoCE (RDMA over Converged Ethernet); ambos têm limitações na forma como lidam com congestionamento e falhas de hardware durante execuções de treinamento.

O MRC estende o RoCE com multipath packet spraying — distribuindo o tráfego por muitos caminhos simultâneos em vez de um único caminho — e o source routing SRv6, que permite ao remetente especificar explicitamente o roteamento dos pacotes através da malha de rede. Combinados, esses recursos permitem que o MRC contorne congestionamentos e falhas de hardware dinamicamente, sem que o job de treinamento pare ou precise reiniciar a partir de um checkpoint.

Crucialmente, o MRC já está em produção. A OpenAI e a Microsoft o implantaram em seus maiores clusters de treinamento, incluindo sistemas construídos com hardware NVIDIA GB200. A especificação foi liberada para o Open Compute Project — o consórcio da indústria que padroniza designs de hardware e rede abertos — tornando-a disponível para outros operadores implementarem sem custos de licenciamento.

Se o MRC alcançar ampla adoção, ele representa a expansão mais significativa do Ethernet na infraestrutura de treinamento de IA, um domínio historicamente dominado pelo InfiniBand no nível mais alto de desempenho. O apoio do consórcio — AMD, Broadcom, Intel, NVIDIA, OpenAI, Microsoft — dá a ele peso industrial suficiente para ser levado a sério pelos operadores de data centers que avaliam arquiteturas de fabric para novos clusters de IA.

O que a independência de modelo da Microsoft significa para o mercado

A parceria entre Microsoft e OpenAI foi estruturada de forma que a Microsoft revende os modelos da OpenAI através do Azure e os integra aos seus produtos. O MAI-Thinking-1 cria uma opção interna alternativa. A Microsoft não disse que o MAI substitui seus acordos com a OpenAI — as duas empresas permanecem fortemente ligadas — mas ter um modelo proprietário dá à Microsoft poder de negociação, reduz sua exposição às decisões de preços da OpenAI e permite oferecer model serving com margens que dependem de seus próprios custos de computação, em vez das taxas da API da OpenAI.

Para clientes empresariais que atualmente usam endpoints do Azure OpenAI, a implicação prática é uma nova opção: um modelo nativo da Microsoft disponível via Microsoft Foundry (atualmente em private preview) que não requer roteamento pela infraestrutura da OpenAI. Se as empresas preferirão o MAI-Thinking-1 ao Claude ou ao GPT-5 para suas cargas de trabalho específicas dependerá de avaliações independentes além do que a Microsoft publicou.

O modelo ainda não está disponível publicamente. O acesso ao private preview do Microsoft Foundry é o ponto de entrada atual. O cronograma de disponibilidade total e os preços não foram anunciados.

Fontes: Microsoft AI; Microsoft Blog; Neowin

Originally reported by Microsoft AI. Read the original article for additional details.

View original source
Compartilhar: