डेटा सेंटर में कई महत्वपूर्ण प्रणालियों में, कूलिंग प्रौद्योगिकियां सबसे तेज़ गति से विकसित हो रही हैं, सबसे खड़ी सीखने की अवस्था की आवश्यकता होती है, और सबसे बड़ा परिचालन जोखिम वहन करती हैं। बड़े पैमाने पर डेटा सेंटर परियोजनाओं में अक्सर अरबों के निवेश शामिल होते हैं, जिससे कोई भी डिज़ाइन त्रुटि बेहद महंगी हो जाती है। इसके अतिरिक्त, जैसे-जैसे डेटा सेंटर की मांग तेजी से विकसित हो रही है, आईटी बुनियादी ढांचे को तेजी से मूल्यह्रास का जोखिम होता है।
डेटा सेंटर कूलिंग में चुनौतियाँ और सामान्य गलत धारणाएँआज, डेटा सेंटर में प्रति वर्ग फुट गर्मी घनत्व एक विशिष्ट कार्यालय स्थान की तुलना में 50 गुना से अधिक हो सकता है, जिसमें आईटी भार अक्सर 30MW से अधिक होता है। कूलिंग सिस्टम को आईटी उपकरणों को इष्टतम तापमान सीमाओं के भीतर रखने के लिए इंजीनियर किया गया है—जैसे NVIDIA DGX H100 क्लस्टर को 5°C और 30°C के बीच बनाए रखना। इन सीमाओं से विचलन उपकरण के जीवनकाल को छोटा कर सकता है, और चूंकि सर्वर और हार्डवेयर डेटा सेंटर की कुल स्वामित्व लागत (TCO) का एक बड़ा हिस्सा हैं, इसलिए कुशल कूलिंग महत्वपूर्ण है।
वर्तमान में, आईटी उपकरणों के अलावा, कूलिंग डेटा सेंटर में दूसरा सबसे बड़ा पूंजीगत व्यय बन गया है, जो विद्युत प्रणालियों के ठीक बाद है। जैसे-जैसे कूलिंग आर्किटेक्चर में विविधता आती है और ऊर्जा दक्षता अधिक महत्वपूर्ण हो जाती है, कूलिंग समाधान अब एक मुख्य डिज़ाइन चुनौती है। क्लाउड सेवा प्रदाताओं के लिए, कूलिंग से संबंधित ऊर्जा लागत एक प्रमुख परिचालन चिंता है, जिसके लिए सिस्टम स्तर पर सावधानीपूर्वक संतुलन की आवश्यकता होती है।
लिक्विड कूलिंग अपनाने के पीछे के चालकों और एआई और प्रशिक्षण डेटा सेंटर में कूलिंग के भविष्य के रुझानों के बारे में गलतफहमी आम हैं। कुछ का मानना है कि लिक्विड कूलिंग हमेशा एयर कूलिंग की तुलना में अधिक ऊर्जा-कुशल होता है, या एयर कूलिंग 1000W से ऊपर की पावर रेटिंग वाले चिप्स को संभाल नहीं सकता है। अन्य सोचते हैं कि एयर कूलिंग वाले कम-पावर सर्वर अनुमान परिदृश्यों के लिए बेहतर हैं। हालाँकि, लिक्विड कूलिंग अपनाने के पीछे असली प्रेरक शक्ति एआई कंप्यूटिंग पावर के लिए टीसीओ का अनुकूलन है—सिर्फ ऊर्जा बचत या “हरित” क्रेडेंशियल नहीं।
लिक्विड कूलिंग का वास्तविक मूल्य: घनत्व और टीसीओ अनुकूलनलिक्विड कूलिंग नया नहीं है—1960 के दशक में डेटा सेंटर ने इसका उपयोग आईबीएम मेनफ्रेम को ठंडा करने के लिए किया था। फिर भी, आधुनिक डेटा सेंटर ने लंबे समय से एयर कूलिंग को पसंद किया है, इसकी कम अग्रिम लागत और एक परिपक्व आपूर्ति श्रृंखला के कारण। जैसे-जैसे डेटा सेंटर का पैमाना बढ़ा है, एयर कूलिंग तकनीक ने गति बनाए रखी है, जिससे ऊर्जा दक्षता बनाए रखते हुए पहले से कहीं अधिक रैक पावर घनत्व की अनुमति मिलती है।
आज भी, एयर कूलिंग एआई स्पेस पर हावी है। उदाहरण के लिए, H100 तैनाती के लिए NVIDIA का संदर्भ डिज़ाइन प्रति रैक में चार एयर-कूल्ड सर्वर की अनुमति देता है, जिसमें कुल बिजली खपत 41kW है। कई डेटा सेंटर में, इसका मतलब है कि ऑपरेटर अक्सर ओवरहीटिंग से बचने के लिए अपने आधे रैक को खाली छोड़ देते हैं। रियर-डोर हीट एक्सचेंजर्स और संलग्न एयरफ्लो कैबिनेट जैसी तकनीकें प्रति रैक घनत्व को 50kW से ऊपर धकेल सकती हैं, लेकिन मुख्य सीमित कारक अक्सर सर्वर का भौतिक आकार और कूलिंग आवश्यकताएं होती हैं।
जबकि लिक्विड कूलिंग को एक बार महंगा माना जाता था, इसकी समग्र लागत आईटी उपकरणों के जीवनचक्र की तुलना में अपेक्षाकृत मामूली है। वास्तविक मूल्य आईटी प्रदर्शन को अधिकतम करने में निहित है: लिक्विड कूलिंग अधिक जीपीयू और एआई एक्सीलरेटर को घनीभूत रूप से पैक और कुशलता से ठंडा करने में सक्षम बनाता है, जिससे उच्च कंप्यूट घनत्व और एक्सीलरेटर के बीच अधिक सहयोग खुल जाता है।
एक प्रमुख उदाहरण NVIDIA GB200 NVL72 सिस्टम है, जो एक ही 120kW रैक में 72 GPU का समर्थन करने के लिए डायरेक्ट-टू-चिप लिक्विड कूलिंग (DLC) का उपयोग करता है। यह सफलता बड़े भाषा मॉडल (LLM) प्रशिक्षण और अनुमान के लिए टीसीओ को काफी कम करने में सक्षम बनाती है, और उच्च-घनत्व, उच्च-प्रदर्शन डेटा सेंटर के लिए एक नया मानक स्थापित करती है।
डेटा सेंटर कूलिंग की अर्थशास्त्र पर पुनर्विचारहालांकि लिक्विड कूलिंग परिचालन लागत को कम कर सकता है (सर्वर फैन पावर बचाने से—कूलिंग से संबंधित ऊर्जा खपत का लगभग 70%), ये बचत अकेले एयर से लिक्विड कूलिंग में पूर्ण बदलाव को उचित ठहराने के लिए पर्याप्त नहीं हैं। उच्च अग्रिम निवेश, बढ़ी हुई रखरखाव जटिलता, और कम परिपक्व आपूर्ति श्रृंखला सभी महत्वपूर्ण कारक हैं। जबकि लिक्विड कूलिंग भौतिक स्थान बचाता है, फर्श स्थान शायद ही कभी डेटा सेंटर में सबसे महंगा संसाधन होता है—अधिकांश लागत अभी भी आईटी लोड से जुड़ी होती है।
लिक्विड कूलिंग का भौतिकी और कार्यान्वयनलिक्विड कूलिंग अधिक कुशल है क्योंकि तरल का एक दिया गया आयतन हवा की तुलना में लगभग 4,000 गुना अधिक गर्मी को अवशोषित कर सकता है। हालाँकि, तरल पंप करने के लिए (जो हवा की तुलना में ~830 गुना अधिक घना है) अधिक ऊर्जा की आवश्यकता होती है, और आवश्यक ऊर्जा प्रवाह दर के सीधे आनुपातिक होती है। डायरेक्ट-टू-चिप लिक्विड कूलिंग रैक घनत्व को नाटकीय रूप से बढ़ा सकता है, लेकिन इसमें टयूबिंग, बड़े पाइप व्यास और अधिक महंगी सामग्री की आवश्यकता जैसी चुनौतियाँ आती हैं।
एक विशिष्ट सेटअप में, तांबे की कोल्ड प्लेटें सबसे गर्म घटकों (सीपीयू और जीपीयू) से जुड़ी होती हैं, जिसमें रैक-स्तरीय वितरण मैनिफोल्ड के माध्यम से ठंडा पानी घूमता है। अन्य घटक, जैसे NIC और स्टोरेज डिवाइस, अभी भी कूलिंग के लिए पंखों पर निर्भर हैं।
आम तौर पर, एक कूलिंग डिस्ट्रीब्यूशन यूनिट (CDU) सिस्टम को पंक्ति या रैक स्तर पर प्रबंधित करता है। जबकि बड़े पैमाने पर तैनाती अक्सर लागत और रखरखाव दक्षता के लिए पंक्ति-स्तरीय सीडीयू का उपयोग करती है, रैक-स्तरीय एकीकृत सीडीयू तेजी से तैनाती और स्पष्ट आपूर्तिकर्ता जिम्मेदारी के लिए अधिक लोकप्रिय हो रहे हैं। सभी मामलों में, सीडीयू डेटा सेंटर व्हाइट स्पेस के भीतर स्थित है।
आगे देखते हुए, जबकि सिंगल-फेज डीएलसी बड़े पैमाने पर अपनाने के लिए तैयार है, दो-फेज और इमर्शन कूलिंग तकनीकों पर शोध जारी है (अगली पीढ़ी के कूलिंग पर अधिक)।
सही कूलिंग समाधान चुननाजैसे-जैसे डेटा सेंटर कूलिंग प्रौद्योगिकियां तेजी से परिष्कृत होती जाती हैं, सही समाधान चुनना उन ऑपरेटरों के लिए महत्वपूर्ण है जो लागत और जोखिम को कम करते हुए कंप्यूट घनत्व को अधिकतम करना चाहते हैं। कूलनेट में, हम डेटा सेंटर कूलिंग समाधानों की एक पूरी श्रृंखला प्रदान करते हैं—पारंपरिक एयर कूलिंग से लेकर उन्नत लिक्विड कूलिंग तक—उच्च-घनत्व एआई और क्लाउड वर्कलोड की जरूरतों को पूरा करने के लिए डिज़ाइन किया गया है।
यदि आप मॉड्यूलर डेटा सेंटर डिज़ाइन में नवीनतम के बारे में अधिक जानना चाहते हैं या देखना चाहते हैं कि कूलनेट के पूर्वनिर्मित मॉड्यूलर डेटा सेंटर उन्नत कूलिंग तकनीकों को कैसे एकीकृत करते हैं, तो मुफ्त परामर्श के लिए हमसे संपर्क करें।
संदर्भ:NVIDIA डेटा सेंटर समाधानचीन IDC सर्कल: डेटा सेंटर कूलिंग रुझान