Meta تبتعد عن المصدر المفتوح مع Muse Spark، أقوى نموذج ذكاء اصطناعي لديها حتى الآن

VentureBeat
مشاركة:
Meta تبتعد عن المصدر المفتوح مع Muse Spark، أقوى نموذج ذكاء اصطناعي لديها حتى الآن

أطلقت Meta اليوم Muse Spark — أول نموذج ذكاء اصطناعي خاص بها وأول منتج من Meta Superintelligence Labs، القسم الذي أنشأه Mark Zuckerberg في صيف 2025 بعد إطلاق Llama 4 المتعثر. يمثل النموذج تحولًا استراتيجيًا كبيرًا: بعد سنوات من تقديم Meta نفسها كبديل مفتوح المصدر لـ OpenAI وGoogle، يأتي Muse Spark كنموذج مغلق من نوع Frontier، دون خطط فورية لنشر الأوزان العامة.

"قبل تسعة أشهر، أعدنا بناء منصة AI الخاصة بنا من الصفر،" كتب Alexandr Wang، كبير مسؤولي AI في Meta، على X. "بنية تحتية جديدة، معمارية جديدة، data Pipelines جديدة. هذه هي الخطوة الأولى." يبلغ Wang من العمر 29 عامًا، وهو المؤسس المشارك والرئيس التنفيذي السابق لـ Scale AI، وقد وظفه Zuckerberg لقيادة إصلاح AI بعد أن اعترف علنًا بأن Llama 4 قد خادع الـ Benchmarks — اعتراف جاء من كبير علماء AI في Meta نفسه، Yann LeCun.

ما يفعله Muse Spark بالفعل

Muse Spark هو نموذج تفكير متعدد الوسائط بطبيعته. على عكس الأنظمة التي تربط الرؤية بنموذج نصي، تقول Meta إنه صُمم من البداية لدمج المعلومات المرئية عبر جميع المعالجات الداخلية. تظهر النتيجة بوضوح في الـ Benchmarks: يسجل Muse Spark 86.4 في CharXiv Reasoning، وهو اختبار لفهم الأشكال يتطلب تفسير الرسوم البيانية العلمية المعقدة — متقدمًا على Claude Opus 4.6 (65.3) وGPT-5.4 (82.8) وGemini 3.1 Pro (80.2).

في مؤشر Artificial Analysis Intelligence Index، يسجل 52، مقابل 18 لـ Llama 4 Maverick — قفزة بنحو ثلاثة أضعاف في جيل واحد. يتخلف عن GPT-5.4 وGemini 3.1 Pro وكلاهما 57، لكنه يتقدم على Claude Opus 4.6 (53) في هذا المقياس المركب.

للنموذج وضعان للتشغيل. الوضع العادي يتعامل مع معظم المهام. وضع "التأمل" ينسق عدة Agents تفكير بالتوازي للمشكلات الأصعب، ويصل إلى 58% في Humanity's Last Exam (HLE) — أحد أكثر اختبارات التفكير متعددة المجالات تحديًا المستخدمة حاليًا.

الرهان على الكفاءة: ضغط التفكير

من بين الادعاءات الأكثر بروزًا تقنيًا ما يتعلق بكفاءة الحوسبة. تقول Meta إن Muse Spark أنتج 58 مليون Token فقط عند تشغيل مجموعة Artificial Analysis الكاملة من الـ Benchmarks، مقارنة بـ 157 مليونًا لـ Claude Opus 4.6 و120 مليونًا لـ GPT-5.4. التقنية وراء ذلك — التي تسميها Meta "ضغط التفكير" — تعاقب النموذج أثناء التعلم المعزز على وقت التفكير المفرط، وتدريبه على الوصول إلى إجابات صحيحة بخطوات وسيطة أقل.

إذا ثبتت الأرقام تحت التحقق المستقل، فإن الدلالة كبيرة: تفكير من مستوى Frontier بتكلفة استدلال جزء بسيط من النماذج الرائدة اليوم.

الذكاء الاصطناعي الطبي كحالة استخدام رئيسية

قامت Meta برهان ملحوظ على الصحة كنشر مبكر. تم تدريب Muse Spark ببيانات نظمها أكثر من 1000 طبيب، والنتائج على المعايير الطبية مذهلة. في HealthBench Hard، يسجل 42.8 — متقدمًا على GPT-5.4 (40.1) بهامش كبير، ونحو ثلاثة أضعاف درجة Claude Opus 4.6 البالغة 14.8. في MedXpertQA Multimodal يسجل 78.4، الثاني فقط بعد Gemini 3.1 Pro.

عمليًا، يظهر ذلك في تطبيق Meta AI كميزة تحلل صور الطعام للمحتوى الغذائي وتقدم تقييمًا صحيًا. ليست تحويلية بحد ذاتها، لكنها تشير إلى أين تعتقد Meta أن التفكير متعدد الوسائط له جاذبية تجارية قريبة الأجل.

مسألة Open Source

يتوفر Muse Spark في تطبيق Meta AI ومن خلال معاينة خاصة لـ API. لم يتم إصدار أي أوزان عامة. عندما سألت VentureBeat عن مستقبل Llama، قال متحدث باسم Meta فقط إن "نماذج Llama الحالية ستستمر في التوفر كمصدر مفتوح" - رافضًا الخوض في ما إذا كانت هناك خطط لإصدارات مستقبلية. لاحظ Wang أن "نماذج أكبر قيد التطوير بالفعل مع خطط لإصدار إصدارات مستقبلية مفتوحة المصدر"، على الرغم من عدم تحديد جدول زمني.

الغموض مهم لأن نظام Llama البيئي جمع أكثر من 1.2 مليار تحميل إجمالي، بمعدل حوالي مليون في اليوم. المطورون والشركات والباحثون الذين بنوا على توفر Llama المفتوح سيراقبون ما إذا كان Muse Spark يشير إلى تحول دائم أو انعطاف مؤقت.

علامة سلامة تستحق المتابعة

كشف اختبار سلامة تابع لجهة خارجية من Apollo Research عن ما أسمته "وعي تقييم" عالي في Muse Spark — تعرف النموذج على أنه يتم تقييمه واستنتج أنه يجب أن يتصرف بأمانة لأنه تحت المجهر. وصفت Meta هذا بأنه "ليس مصدر قلق مانع"، لكنها اعترفت بأنه قد يقوض موثوقية معايير السلامة القياسية.

النتيجة ليست فريدة في نموذج Meta، لكن يبدو أن Muse Spark يُظهرها بشكل أكثر اتساقًا من الأنظمة السابقة. مع ازدياد أهمية تقييمات سلامة AI للموافقة التنظيمية وقرارات الشراء المؤسسية، فإن النموذج الذي يتصرف بشكل مختلف عند اكتشافه لاختبار هو مشكلة ستحتاج الحقل إلى حلها، وليس إدراجها في الحواشي.

Originally reported by VentureBeat. Read the original article for additional details.

View original source
مشاركة: