IRCNF

مایکروسافت اولین مدل استدلال اختصاصی خود را معرفی کرد - و در تست‌های کور از Claude Sonnet 4.6 پیشی گرفت

Microsoft AI
اشتراک‌گذاری:
مایکروسافت اولین مدل استدلال اختصاصی خود را معرفی کرد - و در تست‌های کور از Claude Sonnet 4.6 پیشی گرفت

مایکروسافت در رویداد بیلد ۲۰۲۶ روز ۲ ژوئن از MAI-Thinking-1 رونمایی کرد. این اولین مدل استدلال اختصاصی这家 شرکت است که بدون استفاده از داده‌های آموزشی OpenAI ساخته شده و اولین قدم در خانواده مدل‌های MAI محسوب می‌شود. این اعلام یک تغییر معنادار است: مایکروسافت تا به حال بزرگترین مشتری و توزیع‌کننده محصولات OpenAI بود و حالا یک مدل استدلال رقابتی بومی دارد.

زمان‌بندی جالب توجه است. MAI-Thinking-1 در شرایطی عرضه می‌شود که بازار مدل‌های هوش مصنوعی در حال فشرده شدن است و گزینه‌های Open Source قدرتمند فاصله خود را با مدل‌های اختصاصی مرزی کم کرده‌اند. تصمیم مایکروسافت برای ساختن و عرضه مدل خودش - به جای فروش مجدد یا Fine-tuning مدل‌های OpenAI - هم جنبه اقتصادی دارد (مالکیت مدل هزینه هر Inference را کاهش می‌دهد) و هم واقعیت استراتژیک را نشان می‌دهد: اتکا به یک تأمین‌کننده که هم‌زمان رقیب است، موقعیتی است که اکثر شرکت‌ها ترجیح می‌دهند از آن خارج شوند.

بنچمارک‌ها دقیقاً چه می‌گویند

MAI-Thinking-1 یک مدل با ۳۵ میلیارد پارامتر فعال و پنجره زمینه ۱۲۸ هزار Token (در برخی پیکربندی‌ها ۲۵۶ هزار) است. مایکروسافت نتایج بنچمارک زیر را منتشر کرده:

  • SWE-Bench Pro: ۵۲.۸٪ - مایکروسافت ادعا می‌کند این نتیجه با Claude Opus 4.6 در تسک‌های کدنویسی برابری می‌کند
  • AIME 2025: ۹۷.۰٪
  • AIME 2026: ۹۴.۵٪
  • LiveCodeBench v6: ۸۷.۷٪

ادعای اصلی - اینکه ارزیاب‌های انسانی مستقل در تست‌های کور، MAI-Thinking-1 را از نظر کیفیت کلی در تسک‌های تک‌مرحله‌ای و چندمرحله‌ای به Claude Sonnet 4.6 ترجیح داده‌اند - نوعی بنچمارک است که نیاز به بررسی دارد. ارزیابی‌های ترجیح انسانی می‌تواند بسته به انتخاب Prompt، گروه ارزیابان و چارچوب تسک، تفاوت زیادی داشته باشد. مایکروسافت متدولوژی کامل را منتشر نکرده. با این حال، امتیاز SWE-Bench Pro یک بنچمارک مشخص و قابل تکرار است و ۵۲.۸٪ در رده بالای مدل‌های در دسترس عموم قرار می‌گیرد.

مشخصه «آموزش دیده بدون داده‌های OpenAI» هم از نظر حقوقی و هم فنی اهمیت دارد. این نشان می‌دهد که MAI-Thinking-1 مشتق از مدل‌های خانواده GPT نیست و قابلیت‌های هوش مصنوعی مایکروسافت وابسته به مشارکتش با OpenAI نیست. اینکه این استقلال به کل خانواده مدل‌ها تعمیم می‌یابد یا فقط به همین نسخه، هنوز مشخص نیست.

پروتکل MRC: شبکه‌سازی برای هوش مصنوعی در مقیاس بزرگ

دومین اعلامیه مهم بیلد که باید به آن توجه کرد، پروتکل Multipath Reliable Connection (MRC) است. این یک استاندارد شبکه مبتنی بر RDMA است که توسط OpenAI با همکاری مایکروسافت، AMD، Broadcom، Intel و NVIDIA توسعه یافته است.

MRC برای حل یک مشکل خاص و پیامد طراحی شده است: اجرای همزمان Jobهای آموزشی AI روی هزاران GPU نیازمند شبکه‌ای است که بتواند الگوهای ارتباطی all-reduce در آموزش مقیاس بزرگ را با قابلیت اطمینان بالا و تأخیر کم مدیریت کند. کلاسترهای فعلی AI از InfiniBand یا RoCE استفاده می‌کنند؛ هر دو در نحوه مدیریت ازدحام و خرابی‌های سخت‌افزاری در طول اجرای آموزش محدودیت دارند.

MRC RoCE را با Multipath Packet Spraying گسترش می‌دهد - توزیع ترافیک در چندین مسیر هم‌زمان به جای یک مسیر - و SRv6 Source Routing که به فرستنده اجازه می‌دهد مسیریابی بسته را در سراسر Fabric شبکه مشخص کند. ترکیب این دو به MRC اجازه می‌دهد به طور پویا از ازدحام و خرابی‌های سخت‌افزاری عبور کند، بدون اینکه Job آموزشی متوقف شود یا نیاز به Restart از Checkpoint داشته باشد.

نکته مهم این است که MRC در حال حاضر در Production است. OpenAI و مایکروسافت آن را در بزرگترین کلاسترهای آموزشی خود مستقر کرده‌اند، از جمله سیستم‌های ساخته شده روی سخت‌افزار NVIDIA GB200. مشخصات این پروتکل به Open Compute Project - کنسرسیومی که استانداردهای سخت‌افزار و شبکه باز را استاندارد می‌کند - ارائه شده و برای پیاده‌سازی سایر اپراتورها بدون هزینه لایسنس در دسترس است.

اگر MRC به پذیرش گسترده برسد، نمایانگر مهمترین گسترش Ethernet در زیرساخت آموزشی AI خواهد بود؛ حوزه‌ای که InfiniBand در بالاترین رده عملکردی سهم زیادی داشته. پشتیبانی کنسرسیوم - AMD، Broadcom، Intel، NVIDIA، OpenAI، مایکروسافت - وزن صنعتی کافی به آن می‌دهد تا توسط اپراتورهای دیتاسنتر که معماری Fabric را برای کلاسترهای جدید AI ارزیابی می‌کنند، جدی گرفته شود.

استقلال مدل مایکروسافت چه معنایی برای بازار دارد

مشارکت بین مایکروسافت و OpenAI به گونه‌ای ساختاربندی شده که مایکروسافت مدل‌های OpenAI را از طریق Azure می‌فروشد و در محصولات خود ادغام می‌کند. MAI-Thinking-1 یک گزینه داخلی جایگزین ایجاد می‌کند. مایکروسافت نگفته که MAI جایگزین توافق‌نامه‌های OpenAI می‌شود - این دو شرکت همچنان نزدیک به هم هستند - اما داشتن یک مدل اختصاصی به مایکروسافت اهرم مذاکره می‌دهد، ریسک وابستگی به تصمیمات قیمت‌گذاری OpenAI را کاهش می‌دهد و امکان ارائه خدمات مدل با حاشیه سود مبتنی بر هزینه‌های محاسباتی خودش را فراهم می‌کند.

برای مشتریان سازمانی که در حال حاضر از Azure OpenAI Endpoints استفاده می‌کنند، نتیجه عملی یک گزینه جدید است: یک مدل بومی مایکروسافت که از طریق Microsoft Foundry (در حال حاضر در Private Preview) در دسترس است و نیازی به عبور از زیرساخت OpenAI ندارد. اینکه آیا سازمان‌ها MAI-Thinking-1 را به Claude یا GPT-5 برای Workloadهای خاص خود ترجیح می‌دهند، به ارزیابی‌های مستقل فراتر از آنچه مایکروسافت منتشر کرده بستگی دارد.

این مدل هنوز به صورت عمومی در دسترس نیست. دسترسی Private Preview Microsoft Foundry نقطه ورود فعلی است. جزئیات زمان‌بندی عرضه کامل و قیمت‌گذاری هنوز اعلام نشده است.

منابع: Microsoft AI; Microsoft Blog; Neowin

Originally reported by Microsoft AI. Read the original article for additional details.

View original source
اشتراک‌گذاری: