الفائز الحقيقي من طفرة الذكاء الاصطناعي ليس شركات الذكاء الاصطناعي، بل طبقة البنية التحتية

مشاركة:
الفائز الحقيقي من طفرة الذكاء الاصطناعي ليس شركات الذكاء الاصطناعي، بل طبقة البنية التحتية

كل حمى ذهب تجعل بائعي المجارف مليونيرات. دورة الذكاء الاصطناعي الفائقة 2024-2026 تتبع نفس النمط - بينما تتجادل OpenAI وAnthropic وGoogle حول أي نموذج هو الأذكى، تحقق الشركات التي تبيع GPU والشبكات والطاقة والتبريد والبنية التحتية السحابية إيرادات قياسية بهوامش ربح ضخمة. إليكم طبقة البنية التحتية التي تطبع المال فعليًا.

هيمنة Nvidia المستدامة

إيرادات مركز بيانات Nvidia بلغت 35.6 مليار دولار في ربع واحد (الربع الأول من السنة المالية 2026) - رقم كان سيبدو خياليًا قبل خمس سنوات. الانتقال من H100/H200 إلى بنية Blackwell جارٍ على قدم وساق، مع أنظمة رفوف GB200 NVL72 التي يتجاوز سعرها 3 ملايين دولار لكل رف ولا تزال الطلبيات متراكمة لأرباع قادمة.

القفزة الهندسية الرئيسية في Blackwell هي NVLink 5، التي توفر عرض نطاق ترددي بين GPU يبلغ 1.8 TB/s. هذا يسمح لعنقود استدلال (inference cluster) مكون من 72 GPU بالعمل كمُسرع عملاق واحد - وهو أمر حاسم لخدمة النماذج الكبيرة حيث كانت زمنية التواصل بين GPU تشكل عائقًا صعبًا. يستمر الطلب في تجاوز العرض بهامش واسع، مما يمنح Nvidia قوة تسعير استثنائية.

MI300X من AMD هو منافس حقيقي - فقد تجاوز معدل إيرادات سنوي قدره 5 مليارات دولار ويحقق نشرًا ذا معنى لدى عمالقة الحوسبة السحابية (hyperscalers) ومزودي الخدمات السحابية. لكن نظام CUDA البيئي من Nvidia، الذي بُني على مدى 15 عامًا من أدوات المطورين وتكامل الأطر والمكتبات البرمجية، لا يزال الخندق الرئيسي. الانتقال من CUDA إلى ROCm يتطلب استثمارًا هندسيًا حقيقيًا، ومعظم فرق الذكاء الاصطناعي لا تقوم بهذه المقايضة إلا إذا كانت توفيرات التكلفة ساحقة.

لعبة الشبكات - Ethernet مقابل InfiniBand

الشبكات هي العنقود غير المرئي في بناء عناقيد الذكاء الاصطناعي. InfiniBand، الذي طُور أصلاً للحوسبة عالية الأداء (HPC) ويُسيطر عليه الآن Nvidia (عبر استحواذ Mellanox عام 2020)، يهيمن على عناقيد التدريب عالية الأداء. نسيجه منخفض الزمنية وعالي الإنتاجية مصمم خصيصًا لعمليات all-reduce التي يعتمد عليها التدريب الموزع.

لكن عمالقة الحوسبة السحابية يدفعون للخلف. Google وMicrosoft وMeta يبنون شبكات AI قائمة على Ethernet باستخدام مواصفات Ultra Ethernet Consortium (UEC) - جهد تعاوني لجلب أداء مستوى InfiniBand إلى Ethernet القياسي بتكلفة أقل وبدون تقييد بائع. هذا يخلق فرصة كبيرة لشركات Arista Networks (مفاتيح عالية الراديكس)، Broadcom (ASIC Tomahawk 5 الذي يدفع 51.2 Tbps لكل شريحة)، وCisco.

Broadcom توقعت إيرادات تراكمية من ASIC شبكات AI تتجاوز 60 مليار دولار بحلول 2027 - رقم يعكس النمو العضوي وتحول عمالقة الحوسبة السحابية نحو Ethernet. السيليكون المخصص يسرع نفس الاتجاه: TPUs من Google وAWS Trainium 2 وMaia 100 من Microsoft كلها تقلل الاعتماد على Nvidia لأعباء التدريب، بينما توجه الإنفاق نحو السيليكون الخاص بهم وبائعي الشبكات الذين يربطونه.

الطاقة والتبريد - العنقود المهمل

رف GB200 NVL72 واحد يستهلك 120 كيلوواط. عنقود مكون من 1000 GPU يستهلك 1.67 ميجاواط باستمرار - تقريبًا استهلاك 1400 منزل أمريكي يعمل 24/7. عند تلك الكثافة، لم يعد القيد هو GPU بل توصيل الطاقة والإدارة الحرارية.

مراكز البيانات المبردة بالهواء التقليدية تصل إلى حوالي 20-30 كيلوواط لكل رف. المرافق المحسنة للذكاء الاصطناعي تحتاج إلى التبريد السائل المباشر (DLC) - أنابيب مبرد تجري مباشرة إلى هيكل الخادم، مزيلة الحرارة من المصدر. Vertiv هي إحدى المستفيدات الرئيسية، حيث تورد أنظمة التبريد السائل والبنية التحتية للتبريد الدقيق عالميًا. Eaton توفر أنظمة الطاقة غير المنقطعة (UPS) ووحدات توزيع الطاقة (PDU) على مستوى الرف والصف. خلايا الوقود في الموقع من Bloom Energy تُنشر بشكل متزايد لتكملة شبكة الكهرباء في مرافق AI واسعة النطاق.

صناديق الاستثمار العقاري لمراكز البيانات (Data center REITs) تستفيد من نقص العرض الهيكلي. Equinix وDigital Realty يبنيان حرمًا جامعيًا محسّنًا للذكاء الاصطناعي من الألف إلى الياء - مصممة لكثافات 50-100 كيلوواط لكل رف مع DLC مدمج من الأساس. الديناميكية الرئيسية: مركز بيانات جديد بقدرة 100 ميجاواط وجاهز للذكاء الاصطناعي يستغرق 18-24 شهرًا للترخيص والتصميم والبناء. هذا التراكم يخلق قوة تسعير كبيرة للمشغلين الحاليين الذين لديهم قدرة متاحة اليوم.

طفرة الإنفاق الرأسمالي لعمالقة الحوسبة السحابية

من الصعب المبالغة في حجم إنفاق عمالقة الحوسبة السحابية. Microsoft التزمت بـ 80 مليار دولار في الإنفاق الرأسمالي لعام 2026، بشكل أساسي للبنية التحتية للذكاء الاصطناعي. Google وجهت 75 مليار دولار. Amazon هي الأكبر بـ 105 مليار دولار. هذه ليست التزامات تسويقية - بل تظهر في الأرباح الربعية كإنفاق ملموس على البناء والمعدات.

الأموال تتدفق إلى مجموعة مركزة من الموردين. TSMC تصنع رقاقات H20 وB200 وتتعامل مع التعبئة المتقدمة CoWoS (Chip-on-Wafer-on-Substrate) التي تضع ذاكرة HBM مباشرة على قالب GPU. سعة CoWoS كانت عنقودًا مبلغًا عنه في إنتاج GB200 - TSMC تعمل بكامل طاقتها وتوسع السعة بوتيرة لا تزال متأخرة عن الطلب.

SK hynix وSamsung يوردان HBM3 وHBM3E، الذاكرة عالية النطاق الترددي التي تجعل مسرعات AI الحديثة ممكنة. ASML توفر آلات الطباعة الحجرية EUV التي بدونها لا يمكن تصنيع الرقاقات المتطورة. سلسلة التوريد بأكملها تعمل ساخنة - ولأن كل حلقة تستغرق سنوات لتوسعتها، فإن قوة تسعير الموردين المقيّدين ستستمر حتى عام 2027.

طبقة الشركات الناشئة - معاول وأدوات البنية التحتية

تحت طبقة عمالقة الحوسبة السحابية، موجة من الشركات الناشئة في البنية التحتية تلتقط الطلب الذي لا تستطيع Amazon وMicrosoft وGoogle تلبيته أو لا تريد:

  • CoreWeave: أشهر شركة ناشئة في سحابة GPU. جمعت 11.9 مليار دولار بتقييم 23 مليار دولار في 2025، مبنية على أسطول من H100s من Nvidia تؤجر لشركات AI بأسعار ممتازة. مربحة على أساس كل GPU وتتوسع بقوة في أجهزة Blackwell.
  • Lambda Labs: سحابة GPU مركزة على AI جمعت 320 مليون دولار. تستهدف الباحثين وفرق AI المتوسطة الذين لا يستطيعون الحصول على حصص من عمالقة الحوسبة السحابية - مشكلة حقيقية نظرًا لقوائم انتظار AWS وAzure.
  • Together AI: شركة ناشئة في API الاستدلال (inference) متخصصة في خدمة نماذج متعددة محسّنة. تقدم وصولاً إلى نماذج مفتوحة الأوزان (Llama, Mistral, إلخ) بأسعار تنافسية لكل Token مع تركيز على الإنتاجية.
  • Modal: حوسبة GPU بدون خادم (serverless) للمطورين. تجرد إدارة العنقود - تكتب Python، وتتولى Modal التزويد والتوسع والفواتير لكل ثانية من استخدام GPU الفعلي.
  • Groq: بنت LPU (وحدة معالجة اللغة)، شريحة مصممة خصيصًا للاستدلال. تدعي 500+ Token في الثانية على نماذج من فئة Llama - أسرع بكثير من الاستدلال القائم على GPU بتكلفة مكافئة لأعباء عمل معينة.
  • Cerebras: بنية شريحة بحجم الرقاقة (wafer-scale) تحمل رقاقة سيليكون كاملة في معالج واحد. قدمت مؤخرًا طلب اكتتاب عام. موقع قوي لأعباء التدريب حيث يتجاوز حجم النموذج حدود ذاكرة GPU الفردية.

رياضيات التقييم

شركات البنية التحتية في دورة AI تتداول بمضاعفات إيرادات أعلى 2-3 مرات من معايير البرمجيات التاريخية - ولأسباب قابلة للدفاع. بنية AI التحتية نادرة (مقيدة العرض)، كثيفة رأس المال (حواجز دخول عالية)، ولزجة (تكاليف التحويل حقيقية). هذه هي الظروف التي تبرر المضاعفات الممتازة.

تقييم CoreWeave البالغ 23 مليار دولار على إيرادات سنوية متكررة (ARR) حوالي 4 مليار دولار يعني مضاعف إيرادات 5-6 مرات. يبدو هذا مرتفعًا حتى تقارنه بـ AWS، التي تتداول بحوالي 7 مرات على أعمال أكثر تنوعًا ونضجًا. طبقة البنية التحتية قد تكون في الواقع في موقف أفضل من طبقة النماذج على مدى 3-5 سنوات: النماذج تتحول إلى سلعة مع تقارب البدائل مفتوحة الأوزان، لكن الحوسبة لا تفعل. تكلفة ساعة GPU لا تنخفض فقط لأن LLM جديدة تظهر.

الخاتمة

طفرة AI حقيقية، وموجة الإنفاق الرأسمالي بدأت للتو - إنفاق عمالقة الحوسبة السحابية يتسارع، لا يتباطأ. لكن الرهانات الأكثر أمانًا في هذه الدورة ليست على أي LLM سيفوز بالمعيار التالي (Benchmark). بل على الشركات التي تتقاضى أجرًا بغض النظر عن الفائز.

البنية التحتية للطاقة، ASIC شبكات AI، السيليكون المخصص، ذاكرة HBM، الطباعة الحجرية EUV، وسحابات GPU المتخصصة كلها تستفيد من موجة الإنفاق الرأسمالي سواء هيمن GPT-5 أو Claude 4 أو Gemini Ultra في 2027. شركات النماذج تحرق رأس المال للتمييز. طبقة البنية التحتية تجمع الإيجار.

مشاركة:
الفائز الحقيقي من طفرة الذكاء الاصطناعي ليس شركات الذكاء الاصطناعي، بل طبقة البنية التحتية | IRCNF - Intelligent Reliable Custom Next-gen Frameworks