لماذا يفرض الذكاء الاصطناعي على مراكز البيانات إعادة التفكير في التبريد من الجذور

طوال معظم تاريخ الحوسبة، كان الحفاظ على برودة الخوادم يعني تحريك الهواء. مراوح، أرضيات مرتفعة، ممرات ساخنة وباردة، وحدات تكييف دقيقة تقاس بأطنان التبريد — كان التبريد الهوائي الحل الشامل لأنه بسيط ومفهوم وكافٍ للأحمال الحرارية التي تنتجها الخوادم التقليدية. الذكاء الاصطناعي أنهى تلك الحقبة. مجموعات GPU التي تشغل نماذج اللغة الكبيرة، وتدرب أنظمة الذكاء الاصطناعي التوليدية، وتشغل الاستدلال على نطاق واسع تنتج كثافات حرارية لا يستطيع الهواء إزالتها بالسرعة الكافية. التبريد السائل انتقل من تقنية متخصصة تستخدم في الحواسيب الفائقة وأجهزة الألعاب المرفوعة السرعة إلى شرط أساسي لأي بنية تحتية جادة للذكاء الاصطناعي.
الأرقام التي فرضت التغيير
رف خادم قياسي في مركز بيانات تقليدي يستهلك حوالي 5 إلى 10 كيلوواط. الرف المبرد بالهواء في منشأة عصرية فائقة السعة قد يتعامل مع 15 إلى 20 كيلوواط مع إدارة دقيقة لتدفق الهواء. معالج NVIDIA H100 يستهلك حوالي 700 واط تحت الحمل. رف من ثمانية معالجات H100 يصل إلى 5.6 كيلوواط قبل حساب النظام المضيف والشبكات والتخزين. عنقود تدريب كثيف للذكاء الاصطناعي — النوع المستخدم لتدريب النماذج الحدودية — يمكن أن يصل إلى 100 كيلوواط لكل رف. بعض التكوينات التي يتم نشرها في 2026 تستهدف 300 كيلوواط لكل رف، مع خطط مستقبلية تصل إلى 2 ميغاواط خلال خمس سنوات.
عند هذه الكثافات، التبريد الهوائي ليس خيارًا. السوائل يمكنها نقل الحرارة بكفاءة تصل إلى 3500 ضعف الهواء. الفيزياء ببساطة لا تقبل المقارنة.
التبريد المباشر للرقاقة مقابل التبريد بالغمر
ظهر نهجان للتبريد السائل كالمهيمنين في البنية التحتية للذكاء الاصطناعي. التبريد المباشر للرقاقة يدير سائل التبريد عبر لوحة باردة مثبتة مباشرة على شريحة المعالج. تنتقل الحرارة من الرقاقة إلى السائل并通过 مبادل حراري يتم إزالتها. الخوادم تبدو تقليدية من الخارج؛ تغيير البنية التحتية للتبريد داخلي. التبريد المباشر للرقاقة هو الأكثر انتشارًا لعناقيد GPU اليوم لأنه يمكن تركيبه في مبانٍ موجودة لم تُصمم للغمر الكامل.
التبريد بالغمر يأخذ نهجًا أكثر جذرية بغمر لوحات الخادم بالكامل في سائل عازل غير موصل، إما في أنظمة أحادية الطور حيث يبقى السائل سائلًا، أو أنظمة ثنائية الطور حيث يغلي ويتكثف. التبريد بالغمر يتيح سعة أعلى لإزالة الحرارة، ويدعم التشغيل شبه الصامت (بدون مراوح)، ويمكن أن يقلل بشكل كبير من البصمة المادية لسعة حوسبة معينة. المقايضات هي التكلفة، التعقيد التشغيلي، وحقيقة أن صيانة الأجهزة تتطلب إخراجها من السائل — وهي عملية أكثر فوضوية من تبديل محرك أقراص قابل للتبديل السريع في رف تقليدي.
ماذا يعني هذا لتصميم مراكز البيانات
التحول إلى التبريد السائل ليس مجرد تغيير في الهندسة الحرارية؛ إنه يعيد تشكيل كيفية تصميم وبناء مراكز البيانات. المباني المحسنة للتبريد الهوائي تعتمد على أرضيات مرتفعة، ألواح مثقبة، احتواء الممرات الساخنة والباردة، ومسارات عودة هواء عند السقف. منشأة مبردة بالسائل محسنة لأعباء عمل الذكاء الاصطناعي تحتاج إلى توزيع أنابيب سائل التبريد إلى كل رف، ومبادلات حرارية، وبنية تحتية للمضخات، ووصلات إلى محطة المياه المبردة أو المبردات الجافة.
هذا استثمار رأسمالي كبير لا يمكن للمرافق الحالية تجهيزه بسهولة على نطاق واسع. النتيجة هي انقسام في السوق: مزودو الخدمات السحابية الضخمة والمشغلون الذين يركزون على الذكاء الاصطناعي يبنون مرافق جديدة جاهزة للسوائل من الأساس، بينما مزودو خدمات الاستضافة المشتركة يخصصون مناطق مبردة بالسوائل داخل المباني الحالية لخدمة مستأجري الذكاء الاصطناعي دون إصلاح بنيتهم التحتية بالكامل.
استعادة الحرارة: تحويل المشكلة إلى مورد
نتيجة للتبريد السائل التي تثير اهتمامًا تجاريًا متزايدًا هي جودة الحرارة المهدرة التي ينتجها. مراكز البيانات المبردة بالهواء تطرد حرارة بدرجات حرارة منخفضة جدًا لتكون مفيدة لأي شيء غير تدفئة مبنى كبير. أنظمة التبريد السائل يمكن أن تعمل بدرجات حرارة إمداد تتراوح بين 40 و60 درجة مئوية، مما ينتج سائل عائد بدرجات حرارة عالية بما يكفي لاستخدامها في تدفئة المناطق، الزراعة في البيوت المحمية، تربية الأحياء المائية، أو العمليات الصناعية.
العديد من مراكز البيانات الأوروبية تبيع بالفعل الحرارة المهدرة لشبكات التدفئة البلدية، محولة ما كان سابقًا مركز تكلفة خالصًا إلى مصدر دخل. مع زيادة تسعير الكربون وتدقيق الجهات التنظيمية في استهلاك الطاقة للبنية التحتية للذكاء الاصطناعي، تتحول اقتصاديات استعادة الحرارة من مثيرة للاهتمام إلى مقنعة. منشأة تستطيع تعويض تكاليف التدفئة ببيع الحرارة المهدرة إلى المباني المجاورة تمتلك هيكل تكلفة مختلف جوهريًا عن تلك التي تطرد الحرارة ببساطة في الغلاف الجوي.
نظام التبريد المُدار بالذكاء الاصطناعي
هناك تكرار معين في أحدث تطور في تبريد مراكز البيانات: نماذج الذكاء الاصطناعي تُستخدم بشكل متزايد لإدارة أنظمة التبريد التي تُبقي نماذج الذكاء الاصطناعي قيد التشغيل. منصات الإدارة الحرارية التي تستخدم Machine Learning للتنبؤ بالنقاط الساخنة، وضبط توزيع التبريد ديناميكيًا عبر المناطق، وتوقع احتياجات الصيانة قبل حدوث الأعطال متاحة الآن من معظم بائعي إدارة البنية التحتية لمراكز البيانات. أبلغت Google عن انخفاض بنسبة 40% في طاقة التبريد في بعض المرافق بعد نشر أنظمة تحسين تبريد مدربة بواسطة DeepMind منذ سنوات؛ الجيل الحالي من منصات DCIM المدعومة بالذكاء الاصطناعي يدعي كفاءات مماثلة أو أكبر.
التأثير العملي هو أن تبريد مركز بيانات حديث للذكاء الاصطناعي أصبح مشكلة تحسين مستمر، وليس قرارًا هندسيًا ثابتًا يُتخذ وقت البناء. البنية التحتية التي تُبقي Machine Learning قيد التشغيل هي نفسها تشغل Machine Learning. بالنسبة لمشغلي مراكز البيانات، هذه فرصة كفاءة وفئة جديدة من الاعتماد التشغيلي لإدارتها.