أوبن إي آي تحوّل نموذجي o3 و o4-mini إلى التفكير الهجين، وتخفض تكاليف الاستدلال بنسبة 40%

ما الذي تغير ولماذا يهم

حدّثت أوبن إي آي بنية الاستدلال لنموذجي o3 و o4-mini في أواخر مايو 2026، عبر تقديم ما تسميه الشركة التوسع التكيفي لسلسلة التفكير (adaptive chain-of-thought scaling). بدلًا من تشغيل التفكير الموسع الكامل على كل استعلام، تقوم النماذج الآن بتقييم تعقيد المهمة في طبقة توجيه الـ Prompt وتخصيص الموارد الحاسوبية بشكل متناسب. الاستعلامات البسيطة تحصل على تمريرة تفكير قصيرة؛ بينما البراهين الرياضية متعددة الخطوات وتوليد الأكواد لا تزال تحصل على الميزانية الكاملة.

النتيجة العملية: تكاليف API لنموذج o3 تنخفض من 15 دولارًا لكل مليون Token مخرج إلى 9 دولارات، و o4-mini من 1.10 دولار إلى 0.66 دولار. للمطورين الذين يديرون أحمال عمل عالية الحجم، هذا تغيير جوهري في اقتصاديات الوحدة.

كيف يعمل التفكير الهجين

نماذج سلسلة التفكير التقليدية تنفق نفس الموارد الحاسوبية بغض النظر عن تعقيد الاستعلام. يحل التوسع التكيفي هذه المشكلة عبر تشغيل مصنف خفيف الوزن في وقت الاستدلال يسجل تعقيد الاستعلام عبر أربعة أبعاد: العمق المنطقي، الخصوصية المجالية، مستوى الغموض، وما إذا كانت هناك حاجة لاستكشاف مسارات حل متعددة.

على معيار MMLU، يسجل o3 الهجين ضمن 0.3 نقطة مئوية من o3 كامل الموارد. على LiveCodeBench، يسجل الوضع الهجين 2.4 نقطة أقل.

خلاصات قابلة للتنفيذ

اختبر معلمة reasoning_effort بقيمة adaptive في بيئة تجربة قبل تفعيلها في الإنتاج.
إذا كان تطبيقك يخدم أحمال عمل مختلطة، فسيوفر الوضع التكيفي 25-40% من التكاليف.
لأحمال عمل الترميز عالية المخاطر، أبقِ reasoning_effort على high.