當(dāng)前位置: 首頁(yè) > 數(shù)碼科技

深入了解服務(wù)器液冷方式的多種選擇

2024-06-12 10:52:52 作者：小罐游戲來(lái)源：小罐游戲

　　以多樣選擇、靈活性和效率應(yīng)對(duì)服務(wù)器冷卻挑戰(zhàn)。

　　戴爾科技持續(xù)“以科技創(chuàng)新推動(dòng)人類(lèi)進(jìn)步”的過(guò)程中，亦有障礙拖慢新的解決方案的應(yīng)用。在數(shù)據(jù)中心層面，人工智能(AI)工作負(fù)載便是其中的最典型代表。AI和其他高要求的工作負(fù)載須使用最新的GPU和CPU來(lái)提供所需的應(yīng)用性能，這意味著在部署規(guī)劃過(guò)程中散熱和功耗問(wèn)題時(shí)常出現(xiàn)。為解決這些問(wèn)題，戴爾科技的服務(wù)器散熱工程團(tuán)隊(duì)多年如一，堅(jiān)持提供以客戶為中心的戴爾科技智能冷卻(Dell Smart Cooling)創(chuàng)新解決方案，曾于2016年推出早期液冷服務(wù)器產(chǎn)品Triton。到2024年，戴爾科技提供的服務(wù)器冷卻解決方案包括Verne Global正在使用的Dell DLC3000直接液冷機(jī)架、單機(jī)架功率高達(dá)115千瓦的戴爾科技模塊化數(shù)據(jù)中心等。

　　當(dāng)前的冷卻選擇

　　最新的CPU和GPU對(duì)冷卻技術(shù)提出了新的要求，戴爾科技的PowerEdge產(chǎn)品組合支持不同的冷卻方式。傳統(tǒng)風(fēng)冷在應(yīng)對(duì)最新高功率服務(wù)器每個(gè)機(jī)架所產(chǎn)生的熱量時(shí)頗顯吃力，客戶也正尋求以更加可持續(xù)且低功耗的方式運(yùn)營(yíng)數(shù)據(jù)中心。因此，如今的數(shù)據(jù)中心冷卻方式和策略應(yīng)能滿足客戶日益增長(zhǎng)的多種冷卻需求。

　　在構(gòu)建數(shù)據(jù)中心冷卻環(huán)境時(shí)最常用的技術(shù)包含以下幾種：

　　· 直接液冷(DLC)使用冷板與CPU和GPU等內(nèi)部服務(wù)器元件直接接觸;然后依靠液體來(lái)冷卻冷板并將熱量從處理器中傳遞出去。

　　· 行內(nèi)冷卻解決方案設(shè)計(jì)用于部署在數(shù)據(jù)中心機(jī)架旁的通道中，以冷空氣進(jìn)行冷卻并將其分配到精確位置。

　　· 背門(mén)散熱(RDHx)通過(guò)安裝在服務(wù)器機(jī)架后部的液冷式熱交換器捕獲服務(wù)器排出的熱空氣中的熱量。

　　· 封閉式冷卻指的是將熱氣封閉、冷卻并循環(huán)，所有環(huán)節(jié)均與數(shù)據(jù)中心的任何其它冷卻空氣完全隔離。

　　每種冷卻技術(shù)支持的機(jī)架熱密度和效率不同，為客戶提供了多樣的冷卻方案匹配實(shí)際需求。這些解決方案的部署位置從單機(jī)架到多通道不等。結(jié)合行或機(jī)架封閉結(jié)構(gòu)，行內(nèi)冷卻器可100%捕獲機(jī)架上IT設(shè)備所產(chǎn)生的熱量。如此一來(lái)，數(shù)據(jù)大廳內(nèi)的空調(diào)部署就只需照顧到工作人員即可。RDHx同樣也能捕獲IT設(shè)備所產(chǎn)生的全部熱量，用于機(jī)架上的設(shè)施水，并同時(shí)調(diào)節(jié)空間內(nèi)的空氣。由于這種空調(diào)式的功能，RDHx中設(shè)施水的水溫必須比使用行內(nèi)冷卻器時(shí)更低，前者最高約為20℃，而后者最高可達(dá)32℃。采取較高的設(shè)施水溫，能夠降低冷卻器的運(yùn)行能耗，這一點(diǎn)雖然可喜，但冷卻方案的整體效率并不止于此。

　　通過(guò)將這些熱量捕獲率可達(dá)100%的技術(shù)與DLC相結(jié)合，IT設(shè)備冷卻所需的風(fēng)扇功率得以降低，進(jìn)一步提高了效率。

客戶需求與戴爾科技建議的冷卻解決方案

　　服務(wù)器冷卻效率

　　不同的解決方案和方式在冷卻過(guò)程中所消耗的功率也不同。下圖顯示了在冷卻典型的雙CPU服務(wù)器機(jī)架時(shí)不同冷卻方式的年能耗，分別包含了每種冷卻方式的IT能耗和冷卻能耗。IT能耗即包含內(nèi)部風(fēng)扇在內(nèi)的服務(wù)器內(nèi)部能耗總和;冷卻能耗則代表服務(wù)器外部的冷卻裝置(如冷卻劑分配單元，CDU和機(jī)房空氣處理器，CRAH)和數(shù)據(jù)中心外部的風(fēng)冷冷卻器的能耗。

不同冷卻方式的能耗

　　柱狀圖中第一根柱圖表示的是典型數(shù)據(jù)中心的能耗情況，這種數(shù)據(jù)中心使用安裝在數(shù)據(jù)大廳四周的空氣處理器將空氣吹向服務(wù)器。接下來(lái)，通過(guò)采用DLC來(lái)冷卻每臺(tái)服務(wù)器的CPU，可比僅使用周邊空氣處理器進(jìn)行空氣冷卻節(jié)省約11%的總能耗。而如果用部署于每個(gè)機(jī)架上的RDHx取代周邊冷卻，則每年可減少16%的能耗，在此基礎(chǔ)上再增加DLC可進(jìn)一步減少2%的能耗。如上所述，如果將IT部署在帶有行內(nèi)冷卻器的封閉式機(jī)柜內(nèi)，則可使用溫度較高的水，這也使得其能耗較周邊空氣處理器減少19%。最后，通過(guò)將封閉式冷卻與DLC相結(jié)合，相較傳統(tǒng)冷卻機(jī)架可降低23%的能耗。

　　戴爾科技解決方案的優(yōu)勢(shì)

　　市場(chǎng)上有許多可供選擇的冷卻方式。例如一些廠商選擇在其他內(nèi)部服務(wù)器組件(如內(nèi)存、網(wǎng)絡(luò)接口、存儲(chǔ)等)上使用直接液冷，讓DLC解決方案觸及服務(wù)器內(nèi)部的幾乎所有發(fā)熱組件。通常情況下，這類(lèi)解決方案需要定制化的銅制冷板并在服務(wù)器內(nèi)部鋪設(shè)額外的管道，使所有組件都與液體接觸。在戴爾科技，昂貴且復(fù)雜的銅冷板冷卻方式絕非最佳解決之道，將液體冷卻和空氣冷卻同時(shí)加入到混合式服務(wù)器冷卻解決方案中則可以給企業(yè)帶來(lái)諸多優(yōu)勢(shì)：

　　· 服務(wù)器配置的靈活性顯著提高?？蛻艨勺孕袥Q定服務(wù)器配置(內(nèi)存、PCIe卡、存儲(chǔ)等)，而不必受制于某一種服務(wù)器冷板設(shè)計(jì)。

　　· 設(shè)計(jì)中的軟管和接頭數(shù)量大幅減少，降低發(fā)生泄露的概率。

　　· 現(xiàn)場(chǎng)服務(wù)程序簡(jiǎn)單，便于更換服務(wù)器組件。

　　· 服務(wù)器選擇范圍廣泛。

　　戴爾科技的混合式冷卻方式復(fù)雜性較低，能夠在出現(xiàn)新的和不同的處理器和服務(wù)器平臺(tái)時(shí)更加靈活迅速地為其提供冷卻。

　　戴爾科技的內(nèi)部模型分析表明，如果低水溫解決方案的設(shè)計(jì)合理且管理完善，那么“風(fēng)冷+DLC”混合冷卻部署方式的冷卻能耗僅比其他一些廠商使用的“全冷板冷卻方式”高出3%-4%，并能夠帶來(lái)上述優(yōu)勢(shì)1。

　　充分利用新一代智能冷卻技術(shù)

　　戴爾科技延續(xù)其開(kāi)放靈活的冷卻策略，為客戶提供具有多種選擇，而非“一刀切”的冷卻方式。目前，這些先進(jìn)的數(shù)據(jù)中心冷卻方式正在從高性能計(jì)算集群向主流部署發(fā)展，為支持AI和其他高強(qiáng)度工作負(fù)載的下一代頂尖性能服務(wù)器提供助力。戴爾科技的智能冷卻解決方案已幫助許多PowerEdge客戶提高了服務(wù)器的整體冷卻能力、能效和可持續(xù)性。