مایکروسافت اولین مدل استدلال اختصاصی خود را معرفی کرد - و در تستهای کور از Claude Sonnet 4.6 پیشی گرفت

مایکروسافت در رویداد بیلد ۲۰۲۶ روز ۲ ژوئن از MAI-Thinking-1 رونمایی کرد. این اولین مدل استدلال اختصاصی这家 شرکت است که بدون استفاده از دادههای آموزشی OpenAI ساخته شده و اولین قدم در خانواده مدلهای MAI محسوب میشود. این اعلام یک تغییر معنادار است: مایکروسافت تا به حال بزرگترین مشتری و توزیعکننده محصولات OpenAI بود و حالا یک مدل استدلال رقابتی بومی دارد.
زمانبندی جالب توجه است. MAI-Thinking-1 در شرایطی عرضه میشود که بازار مدلهای هوش مصنوعی در حال فشرده شدن است و گزینههای Open Source قدرتمند فاصله خود را با مدلهای اختصاصی مرزی کم کردهاند. تصمیم مایکروسافت برای ساختن و عرضه مدل خودش - به جای فروش مجدد یا Fine-tuning مدلهای OpenAI - هم جنبه اقتصادی دارد (مالکیت مدل هزینه هر Inference را کاهش میدهد) و هم واقعیت استراتژیک را نشان میدهد: اتکا به یک تأمینکننده که همزمان رقیب است، موقعیتی است که اکثر شرکتها ترجیح میدهند از آن خارج شوند.
بنچمارکها دقیقاً چه میگویند
MAI-Thinking-1 یک مدل با ۳۵ میلیارد پارامتر فعال و پنجره زمینه ۱۲۸ هزار Token (در برخی پیکربندیها ۲۵۶ هزار) است. مایکروسافت نتایج بنچمارک زیر را منتشر کرده:
- SWE-Bench Pro: ۵۲.۸٪ - مایکروسافت ادعا میکند این نتیجه با Claude Opus 4.6 در تسکهای کدنویسی برابری میکند
- AIME 2025: ۹۷.۰٪
- AIME 2026: ۹۴.۵٪
- LiveCodeBench v6: ۸۷.۷٪
ادعای اصلی - اینکه ارزیابهای انسانی مستقل در تستهای کور، MAI-Thinking-1 را از نظر کیفیت کلی در تسکهای تکمرحلهای و چندمرحلهای به Claude Sonnet 4.6 ترجیح دادهاند - نوعی بنچمارک است که نیاز به بررسی دارد. ارزیابیهای ترجیح انسانی میتواند بسته به انتخاب Prompt، گروه ارزیابان و چارچوب تسک، تفاوت زیادی داشته باشد. مایکروسافت متدولوژی کامل را منتشر نکرده. با این حال، امتیاز SWE-Bench Pro یک بنچمارک مشخص و قابل تکرار است و ۵۲.۸٪ در رده بالای مدلهای در دسترس عموم قرار میگیرد.
مشخصه «آموزش دیده بدون دادههای OpenAI» هم از نظر حقوقی و هم فنی اهمیت دارد. این نشان میدهد که MAI-Thinking-1 مشتق از مدلهای خانواده GPT نیست و قابلیتهای هوش مصنوعی مایکروسافت وابسته به مشارکتش با OpenAI نیست. اینکه این استقلال به کل خانواده مدلها تعمیم مییابد یا فقط به همین نسخه، هنوز مشخص نیست.
پروتکل MRC: شبکهسازی برای هوش مصنوعی در مقیاس بزرگ
دومین اعلامیه مهم بیلد که باید به آن توجه کرد، پروتکل Multipath Reliable Connection (MRC) است. این یک استاندارد شبکه مبتنی بر RDMA است که توسط OpenAI با همکاری مایکروسافت، AMD، Broadcom، Intel و NVIDIA توسعه یافته است.
MRC برای حل یک مشکل خاص و پیامد طراحی شده است: اجرای همزمان Jobهای آموزشی AI روی هزاران GPU نیازمند شبکهای است که بتواند الگوهای ارتباطی all-reduce در آموزش مقیاس بزرگ را با قابلیت اطمینان بالا و تأخیر کم مدیریت کند. کلاسترهای فعلی AI از InfiniBand یا RoCE استفاده میکنند؛ هر دو در نحوه مدیریت ازدحام و خرابیهای سختافزاری در طول اجرای آموزش محدودیت دارند.
MRC RoCE را با Multipath Packet Spraying گسترش میدهد - توزیع ترافیک در چندین مسیر همزمان به جای یک مسیر - و SRv6 Source Routing که به فرستنده اجازه میدهد مسیریابی بسته را در سراسر Fabric شبکه مشخص کند. ترکیب این دو به MRC اجازه میدهد به طور پویا از ازدحام و خرابیهای سختافزاری عبور کند، بدون اینکه Job آموزشی متوقف شود یا نیاز به Restart از Checkpoint داشته باشد.
نکته مهم این است که MRC در حال حاضر در Production است. OpenAI و مایکروسافت آن را در بزرگترین کلاسترهای آموزشی خود مستقر کردهاند، از جمله سیستمهای ساخته شده روی سختافزار NVIDIA GB200. مشخصات این پروتکل به Open Compute Project - کنسرسیومی که استانداردهای سختافزار و شبکه باز را استاندارد میکند - ارائه شده و برای پیادهسازی سایر اپراتورها بدون هزینه لایسنس در دسترس است.
اگر MRC به پذیرش گسترده برسد، نمایانگر مهمترین گسترش Ethernet در زیرساخت آموزشی AI خواهد بود؛ حوزهای که InfiniBand در بالاترین رده عملکردی سهم زیادی داشته. پشتیبانی کنسرسیوم - AMD، Broadcom، Intel، NVIDIA، OpenAI، مایکروسافت - وزن صنعتی کافی به آن میدهد تا توسط اپراتورهای دیتاسنتر که معماری Fabric را برای کلاسترهای جدید AI ارزیابی میکنند، جدی گرفته شود.
استقلال مدل مایکروسافت چه معنایی برای بازار دارد
مشارکت بین مایکروسافت و OpenAI به گونهای ساختاربندی شده که مایکروسافت مدلهای OpenAI را از طریق Azure میفروشد و در محصولات خود ادغام میکند. MAI-Thinking-1 یک گزینه داخلی جایگزین ایجاد میکند. مایکروسافت نگفته که MAI جایگزین توافقنامههای OpenAI میشود - این دو شرکت همچنان نزدیک به هم هستند - اما داشتن یک مدل اختصاصی به مایکروسافت اهرم مذاکره میدهد، ریسک وابستگی به تصمیمات قیمتگذاری OpenAI را کاهش میدهد و امکان ارائه خدمات مدل با حاشیه سود مبتنی بر هزینههای محاسباتی خودش را فراهم میکند.
برای مشتریان سازمانی که در حال حاضر از Azure OpenAI Endpoints استفاده میکنند، نتیجه عملی یک گزینه جدید است: یک مدل بومی مایکروسافت که از طریق Microsoft Foundry (در حال حاضر در Private Preview) در دسترس است و نیازی به عبور از زیرساخت OpenAI ندارد. اینکه آیا سازمانها MAI-Thinking-1 را به Claude یا GPT-5 برای Workloadهای خاص خود ترجیح میدهند، به ارزیابیهای مستقل فراتر از آنچه مایکروسافت منتشر کرده بستگی دارد.
این مدل هنوز به صورت عمومی در دسترس نیست. دسترسی Private Preview Microsoft Foundry نقطه ورود فعلی است. جزئیات زمانبندی عرضه کامل و قیمتگذاری هنوز اعلام نشده است.
منابع: Microsoft AI; Microsoft Blog; Neowin
Originally reported by Microsoft AI. Read the original article for additional details.
View original source