資料中心或網路機房內降低 冷卻性能的可避免錯誤 第 49 號白皮書 版本 2 作者 Neil Rasmussen 目錄 >摘要 在資料中心或網路機房內安裝冷卻系統時,通常會出現一些 可避免的失誤,進而會降低可用性並增加成本。這些無意的 疏忽會導致形成熱區、降低容錯能力、效率和 冷卻性能。儘管使用者均安排了設施操作員來解決冷卻問 題,但實際上許多問題均由 IT 設備的不當部署造成,超出了 他們所能控制的範圍。本白皮書詳細分析了這些典型錯誤, 闡述了其原理和影響,並介紹了一些簡單的解決方案。 白皮書現收錄於施耐德電機白皮書資料庫 由施耐德電機資料中心科研中心發表, DCSC@Schneider-Electric.com 簡介 2 基本空氣流通要求 3 機櫃內的空氣流通 3 機櫃佈局 6 設備分佈 7 冷卻設置 8 送風口與回風口佈局 8 透過策略加以預防 10 結論 11 資源 12 資料中心或網路機房內降低冷卻性能的可避免錯誤 簡介 多數資料中心和網路機房都存在各種基本的設計和配置缺陷,這可能會導致無法獲得既定的冷卻 性能,同時阻礙冷空氣的流通。這些問題通常不會被發現,因為電腦機房通常以遠低於設計目標 的功率密度運行。然而,全新 IT 設備功率密度的增加,使得資料中心逐漸接近其設計極限,進而 暴露出了無法提供有效冷卻性能的問題。 低效冷卻性能除可能降低系統可用性外,還可能導致成本大幅增加。本白皮書詳細闡述了一些常 見設計缺陷,它們可能將冷卻系統的效應降低 20% 或更多。Lawrence Berkeley 國家實驗室和 APC 公司進行的獨立研究顯示,在一個消耗功率如圖 1 所示的典型資料中心內,冷卻系統消耗的功率 相當於整個 IT 負載消耗的功率。冷卻效率降低 20%,便可能導致整個功率消耗增加 8%,這對於 一個使用壽命為 10 年的 500 kW 資料中心而言,額外浪費的電力成本約為 70 萬美元。然而,這一 嚴重的浪費本可以避免,同時根本不會或只會造成很少的成本。 製冷系統 37% 圖1 IT設備 45% 典型資料中心功率消耗分佈 照明設備 3% 供電系統 15% 多種問題導致使用者需要對資料中心的冷卻系統進行進一步優化。這些問題來源包括冷卻設備自 身的設計和規範問題,以及整套系統向設備提供冷空氣的過程等。本白皮書重點介紹了與冷空氣 分配相關的冷卻問題,以及與 IT 設備部署相關的設置問題,主要考慮因素如下: 這些均為實用、可行的且經過驗證的解決方案 許多補救措施已應用於當前的資料中心內 重要的改進措施無需或只須很少的投資即可完成 IT 人員和設施員工均可以採取相應補救措施 解決方案不受設施或地理區域的限制。 這些問題均可以透過簡單的政策加以解決 本白皮書將常見缺陷分為五類,並按順序逐一闡明: 機櫃內的空氣流通 機櫃佈局 設備分配 冷卻設置 送風口與回風口佈局 施耐德電機 — 資料中心科研中心 第 49 號白皮書 版本 2 2 資料中心或網路機房內降低冷卻性能的可避免錯誤 對於每一類缺陷,文章均介紹了一系列問題,並簡單闡述了問題的原理,以及它對可用性和擁有 權總成本的影響。該類資訊在表中做了相應的匯總。 文章最後介紹了一些能夠顯著提高資料中心的可用性和大幅降低擁有權總成本策略。 基本空氣流通要求 機櫃內及周圍的空氣流通對於冷卻性能至關重要。理解機櫃空氣流通的關鍵是掌握基本原理,即 IT 設備受兩種因素的影響: 1. 經調節的空氣由設備進氣口進入; 2. 設備氣流的輸入和輸出不受限制。 經常發生並導致無法實現最佳情況的兩個主要問題是: 1. CRAC 氣體在到達設備進氣口之前與廢熱混合在一起; 2. 設備空氣流通受到障礙物的阻隔。 文章下一部分介紹了導致產生這兩個問題的實施決策,以及可用來解決這些降低可用性和提高成 本的問題的通用解決方案。 機櫃內的空氣流通 儘管機櫃通常被認為是一種機械支架,但它對於防止設備排出的廢熱重新循環進入設備進氣口至 關重要。廢熱將被輕微增壓,再加上設備進氣過程中的吸力,將可能導致廢熱被重新吸入設備進 氣口。這一結果的影響要遠遠大於廢熱浮力的影響。人們通常認為後者能夠使得廢熱從設備中被 排出。機櫃及其盲板提供了一個自然屏障,能夠顯著延長空氣再循環路徑的長度,進而減少進入 設備進氣口的廢熱量。 資源連結 第 44 號白皮書 利用氣流管理盲板改善機櫃 冷卻效果 儘管所有主要的 IT 設備製造商均強烈建議使用盲板,但實際上 90% 或更高比例的資料中心都忽 略了這一點。空氣再循環問題可能導致 IT 設備的溫度上升 15°F 或 8°C。有關這一結果及實驗資 料的詳細說明,請參閱 第 44 號 白皮書《利用氣流管理盲板改善機櫃冷卻效果》。盲板可以改善 機櫃空氣流通效果,如圖 2 所示。安裝盲板是一個極其簡單的流程,可以極低的成本應用於幾乎 所有資料中心。 側面 側面 圖2 沒有盲板的空氣再迴圈 盲板 2A. 無盲板 2B. 有盲板 施耐德電機 — 資料中心科研中心 第 49 號白皮書 版本 2 3 資料中心或網路機房內降低冷卻性能的可避免錯誤 許多機櫃配置均暴露出了一些其它缺陷,可造成與缺乏盲板類似的結果。使用寬機櫃和嵌入滑軌 使得空氣可以透過機櫃滑軌側面進行循環。使用托架安裝 IT 設備會阻礙盲板的使用,從而為廢熱 的再循環提供了完全開放的路徑。 一些標準的 19 英寸機櫃在滑軌周圍、主機殼的頂部和底部均提供了內置的空氣循環路徑。在這 種情況下,安裝盲板不能完全控制空氣的再循環。許多機櫃的設計不能適用於高密度 IT 環境中。 採用標準機櫃和盲板可以大幅減少空氣再循環比例,並降低熱點的數量。 透過使用盲板和選擇可以有效控制循環的機櫃對於降低熱點溫度的優勢顯而易見,並可顯著提高 系統可用性。然而,還有一些優勢雖然不太明顯,但卻非常重要,需要進行說明。 短循環對容錯能力的影響 與合理實施的系統相比,短循環非常嚴重的機櫃系統會導致系統容錯能力和可維護性大幅降低。 在大多數安裝中,冷卻性能均透過一系列服務於通用供氣通分系統的 CRAC 元件提供。在此類配 置中,當其中一個 CRAC 系統由於故障或維護停止工作時,其它 CRAC 元件將能夠自動接替其工 作,繼續提供冷卻功能。空氣短循環可在以下幾方面減弱這一容錯能力: 短循環造成較低的 CRAC 回流空氣溫度,可能導致其餘 CRAC 元件以較低的性能工作,進 而無法滿足冷卻性能要求; 剩餘系統無法提供克服短循環效應所需的較高供氣速度,從而導致短循環增加和設備溫度 過高。 短循環對擁有權總成本的影響 溫度過高和容錯能力導致的系統可用性問題使標準機櫃和盲板的使用成為一個令人關注焦點。然 而,短循環導致的 TCO 後果極其嚴重,使得這一情形最為突出。 與冷卻性能相關的最大生命週期成本是運行冷卻設備和風扇需要消耗的功率的成本。資料中心冷 卻消耗的功率(瓦特或噸)不受短循環的影響,但冷卻系統的效應卻會受到顯著的負面影響。這 意味著短循環將會加大與電力相關的成本。相應成本組合如圖 3 所示。 圖 3 列舉了透過解決短循環的主要症狀(即熱點)所帶來的結果。兩個解決熱點最常用的方案是 降低 CRAC 供氣溫度,或增強 CRAC 性能,或二者兼用。這些方案可能需要耗費大量不可預知的 成本,如圖所示。然而,本白皮書介紹的透過設計和政策控制短循環的方案,將僅需很少的成本, 並能夠避免產生圖中所示的結果。 施耐德電機 — 資料中心科研中心 第 49 號白皮書 版本 2 4 資料中心或網路機房內降低冷卻性能的可避免錯誤 空氣循環 熱區溫度 高出正常區域 15°F (8°C) 降低 CRAC 溫度設定點 9°F (5°C) 增加 20% 額外CRAC 容量 減少 CRAC 容量 圖3 增加 額外的 除濕工作 較低的 回風溫度 迴圈造成的財務後果關聯圖 降低 CRAC 效率 10% 損耗 額外的 風機功率 5% 損耗 增加額外的 補償加濕 5% 損耗 降低 CRAC 效率 5% 損耗 10-25% 額外製冷成本 $300,000 至 $700,000 浪費 對於一個500 kW的負載在10年的使用期內 空氣流通的限制使得設備無法獲得新鮮空氣,進而導致溫度升高。此外,機櫃前端或後端的氣流 限制還會加大在沒有盲板的機櫃空間內的空氣短循環情況。 因此,至關重要的一點是需要使用帶有出色通分性能並在其後端擁有足夠空間的機櫃,以避免線 纜包阻礙空氣的流通。用戶有時選擇使用淺機櫃,認為它將能夠增加地面空間利用率,但由於線 纜阻礙空氣流通所造成的散熱限制,將導致無法充分利用密度。 施耐德電機 — 資料中心科研中心 第 49 號白皮書 版本 2 5 資料中心或網路機房內降低冷卻性能的可避免錯誤 表1 機櫃空氣流通設計缺陷及後果總結 設計缺陷 可用性後果 TCO 後果 解決方案 沒有盲板 在托架上安裝設備 使用沒有滑軌擋風條 的 584mm( 23 英寸) 機櫃 形成熱點,特別是在機櫃 頂部 冷卻冗餘能力降低 電力成本 降低了 CRAC 性能 耗水量 加濕器維護 機櫃下方線通道沒有 擋風條 形成熱點,特別是在機櫃 頂部 高架地板靜壓降低 冷卻冗餘能力降低 CRAC 效率降低 為機櫃下方的線纜通道使用擋風條或 墊圈 玻璃門 沒有通風口的門 過熱問題 加重了沒有盲板導致的後 果 降低空間和機櫃利用率 為前後門添加通風口 使用風扇託盤和吊扇 優勢幾乎可以忽略不計, 此類投資應用於其它更實 用的目的 浪費資本 浪費電力 不使用風扇託盤或吊扇 淺機櫃 線纜障礙物導致溫度過高 降低空間和機櫃利用率 使用帶有足夠深度的機櫃,以允許空 氣自由穿過線纜 資源連結 第 46 號白皮書 超高密度機櫃和刀片式伺服 器散熱策略 使用盲板 不使用托架 使用在滑軌外沒有開放空間的機櫃 在寬機櫃上,為滑軌添加擋風條 除了上述控制機櫃空氣流通的被動方案外,帶有風扇系統的機櫃也可用來控制機櫃空氣的分配。 一些機櫃風扇系統,諸如風扇託盤和吊扇等,具備的優勢微乎其微。其它風扇系統,如將底層空 氣輸向機櫃前端的系統,或從機櫃後端排出廢熱的系統,可以有效改進機櫃內的空氣流通,減少 短循環和提高機櫃功率使用容量。有關這些系統的詳細說明,請參閱 第 46 號白皮書《超高密度 機櫃和刀鋒式伺服器散熱策略》。 透過將專為改進供氣風扇元件設計的機櫃標準化,可以有效滿足未來的高密度要求。 機櫃佈局 上一部分介紹的合理機櫃空氣流通控制對於有效的冷卻至關重要,但離目標還有一段距離。機櫃 空間的合理佈局對於確保機櫃擁有適當溫度和數量的空氣非常重要。空氣到機櫃的流通是關鍵。 合理機櫃佈局的目標也是控制短循環,即避免 CRAC 空氣在到達設備進氣口前與廢熱混合在一起。 具體設計原理基本相同:盡可能將廢熱與設備進氣口氣體隔離。 這一問題的解決方案應用甚廣。透過將機櫃按行排列,同時扭轉機櫃交叉行的方向,可以大幅降 低短循環現象。這一解決方案的原理在 Uptime Institute 的白皮書中進行了詳細介紹,書名為《更 改冷熱通道可為伺服器群帶來更可靠的冷卻性能》。 除冷熱通道系統具備的明顯優勢外,調查還指出,大約 25% 的資料中心和網路機房將每行機櫃面 向統一方向。將機櫃置於統一方向可能導致嚴重的短循環問題,幾乎肯定會出現“熱點”,同時系 統運行成本也將大幅提高。具體成本將根據安裝情況的不同而有所差異,詳細資訊請參閱圖 3。 施耐德電機 — 資料中心科研中心 第 49 號白皮書 版本 2 6 資料中心或網路機房內降低冷卻性能的可避免錯誤 冷熱通道技術的有效應用不僅僅是將機櫃變為交叉行。在使用冷熱通道技術的 75% 的安裝中,有 30% 未能合理安排空氣分配和回流系統,從而不能為機櫃行有效供氣。這一部分將在稍後的“送 風口與回風口設計”部分中介紹。 對於機櫃朝向統一方向、且未使用冷熱通道技術的環境,APC 的調查顯示大多數均是按照管理層 指示放置,目的為保持資料中心的美觀。調查認為如果能夠確定指示造成的後果,則可以避免做 出此類決策。 對於機櫃朝向統一方向的系統而言,本文中介紹的多種技術的效果將會大打折扣。如果未能使用 交叉行,那麼解決這一環境中的熱點的一個有效辦法將是,為受影響的機櫃提供一個補充供氣設 備。 表2 機櫃佈局設計缺陷和後果總結 設計缺陷 TCO 後果 可用性後果 解決方案 機櫃朝向統一方向未 實施冷熱通道技術 沒有按行排列 問題如上 如上 將機櫃按行排列 按行排列,但不緊湊 問題如上 如上 減少機櫃間縫隙 不要隔離機櫃 機櫃朝向統一方向未 實施冷熱通道技術 消耗過多功率 耗水量 加濕器維護 設備分佈 熱點 冷卻冗餘能力降低 冷卻性能降低 加濕故障 熱點 冷卻冗餘能力降低 冷卻性能降低 加濕故障 消耗過多功率 耗水量 加濕器維護 使用冷熱通道佈局 使用冷熱通道佈局 設備的位置,特別是高功率設備的位置,可能顯著增加資料中心面臨的壓力。當高密度、高性能 伺服器被組合成一個或多個機櫃時,便會出現高密度設備群。這種情況可能導致資料中心非常容 易出現熱點,並要求操作員採取正確措施,諸如降低空氣溫度設置點或添加 CRAC 元件等。這些 措施進一步加劇了圖 3 中總結的後果。 資源連結 基於這些原因,盡可能分散放置設備將可以帶來顯著優勢。同時幸運的是,分散放置設備不會受 到光纖和乙太網連接的影響。IT 人員通常會將設備放置在一起,並認為此種方法更為方便。對於 第 46 號白皮書 這些人員,需要向其介紹分散放置設備可以帶來的可用性優勢和成本節省。 超高密度機櫃和刀片式伺服 器散熱策略 表3 設備分佈設計缺陷和後果總結 其它方法也可以幫助高功率機櫃避免受到負面冷卻影響。如欲瞭解有關這一主題的更詳細論述, 請參閱第 46 號白皮書《超高密度機櫃和刀鋒式伺服器散熱策略》。 設計缺陷 可用性後果 TCO 後果 解決方案 集中放置設備 熱點 冷卻冗餘能力降低 消耗過多功率 盡可能分散放置 設備 施耐德電機 — 資料中心科研中心 第 49 號白皮書 版本 2 7 資料中心或網路機房內降低冷卻性能的可避免錯誤 冷卻設置 上一部分探討了降低 CRAC 空氣溫度設置點的負面影響。當 CRAC 輸出氣體溫度最高時,空調性 能也將達到最高。理想狀態下,如果沒有短循環,CRAC 輸出氣體溫度將與電腦設備的 18-21°C (65 - 70 °F)一致。這一假設不切實際,實際中 CRAC 輸出氣體溫度通常比電腦進氣溫度略低。 然而,如果能夠遵循本文介紹的空氣分配時間,則可以將 CRAC 溫度設置點設為最高。為了最大 限度地提高容量和優化性能,CRAC 設置點不應低於維持設備進氣溫度所需的點。 儘管 CRAC 溫度設置點由空氣分配系統決定,然而濕度卻可以調整到任意最佳值。如果濕度值高 出要求,可能導致惡劣後果。首先,CRAC 將導致水分凝結,降低空氣濕度。除濕功能會顯著降 低 CRAC 設備的空氣冷卻性能。然而更糟的是,加濕器需要更換透過空氣獲得的水分。在一個典 型資料中心,這一情況每年會浪費數千加侖的水。同時加濕器也是一個主要的散熱源,必須進行 冷卻,從而會嚴重降低 CRAC 設備的冷卻性能。當存在空氣短循環時,將更是雪上加霜,因為較 低溫度的 CRAC 氣體會更容易凝結。因此至關重要的一點是:切勿使資料中心的濕度值高出需求。 一些資料中心,包括大多數早期資料中心,均含有高速紙張印表機或幅面印表機。這些印表機會 產生大量靜電。要消除這些靜電,資料中心的濕度必須保持在 50% 左右。然而,對於沒有高速 幅面印表機的資料中心而言,則濕度應保持在 35% 左右,以消除靜電。將資料中心的濕度值設 為 35%,而不是 45% 或 50%,可以節約大量的水和能源,特別是在空氣短循環非常嚴重的環境 中。 對於採用帶有加濕器的多個 CRAC 設備的資料中心而言,可能還會發生其它問題。在此類環境中, 最常見的問題便是兩個 CRAC 設備可能互相抵消濕度。當以下條件為真時,便可能發生上述情況: 兩個 CRAC 的回流氣體溫度不一致,或兩個設備的濕度感測器校準不一致,或兩個 CRAC 設備被 設定成不同的濕度值。一個 CRAC 設備會降低空氣的濕度,另一個則會增加空氣的濕度。這一運 行模式極其浪費,而且資料中心操作員也不易發現。 無意義的 CRAC 濕度抵消問題可透過以下方法解決:A) 使用中央濕度控制;B) 協調 CRAC 設備的 濕度值;C) 關閉 CRAC 中的一個或多個加濕器;或 D) 使用不工作區設定。這些技術各具自己的 優勢,本文將不進行詳細論述。如果帶有獨立 CRAC 的系統發生上述問題,最可行的辦法為確認 系統設定是否相同,或校準是否相同,同時擴大不工作區濕度設定(大多數 CRAC 設備均提供了 這一功能)。通常,將不工作區值設定為 +/-5%,便可以糾正這一問題。 設計缺陷 濕度設定過高 多個 CRAC 設備在 同一空間內互相抵 消濕度 送風口與回風口 佈局 可用性後果 TCO 後果 形成熱點 消耗過多功率 冷卻冗餘能力 降低 耗水 解決方案 將濕度設定為 35-40% 加濕器維護 冷卻冗餘能力 降低 消耗過多功率 冷卻性能降低 加濕器維護 耗水 將所有設備的濕度不工作 區值設定為 5% 使用中央加濕器 關閉不必要的加濕器 機櫃氣流和機櫃設計是引導空氣以最大限度改進冷卻效果的關鍵因素。但要確保最佳冷卻效果, 還有一個關鍵因素,即送風口與回風口設計。這些通風口的位置不當會使 CRAC 空氣在到達負載 設備前與廢熱相混合,從而引發上述各種性能問題和額外成本。輸送或回風口位置不當的情況很 常見,幾乎會消除所有冷熱通道設計優勢。 施耐德電機 — 資料中心科研中心 第 49 號白皮書 版本 2 8 資料中心或網路機房內降低冷卻性能的可避免錯誤 送風口的關鍵在於將其置於盡可能鄰近設備進氣口處,將冷空氣限制在冷通道內。對於地板下空 氣分佈,意味著要將通風地磚置於冷通道內。架空分配與高架地板分配系統一樣有效,但關鍵還 是將分配通風口置於冷通道上部,而且這些通風口的設計必須要能引導空氣直接向下進入冷通道 (而不是橫向進入擴散風口)。在架空或地板下系統中,任何通風口若位於不操作設備的位置, 均應關閉,因為這些通風口會阻止回風進入低溫 CRAC 設備,從而會除去濕氣並降低 CRAC 性能。 回風口的關鍵在於將其置於盡可能鄰近設備排氣口的位置,並從熱通道收集熱空氣。在某些情況 下,使用架空吊頂強制通風,這樣回風口便可輕鬆與熱通道進行協調。當使用高敞開式整回風天 花板時,最好的方法是將 CRAC 設備的回風口置於天花板盡可能高的位置,並用管道系統展開回 風口,以協調回風口與熱通道。甚至只有少數幾個回風口、與熱通道強制協調的粗糙回風系統也 比房間側面的單一大型回風口效果要 >封閉地板上的佈線切口 好。 在高架地板環境下的佈線切口會引起絕大多數的 對於沒有高架地板或管道系統的小房 非預期的空氣洩漏,而且應該被封閉。基於對許 間,上游或下游 CRAC 裝置通常位於牆 多資料中心的測量,由於沒有封閉敞開的地板, 角或牆邊。在這些情況下,很難協調 50-80%的有價值的冷風無法到達 IT 設備的進風 冷通道的冷空氣輸送與熱通道的熱回 口。這部分損失的冷風,又叫作氣流旁路,導致 風。在這些情況下性能會受到影響。 但以下方法可能會提高這些系統的性 能: 對於上游設備,將其置於鄰近熱 通道的末端,盡可能地遠離 CRAC 設備。 對於下游設備,將其置於冷通道 (用於將空氣吹入冷通道)的末 端,並添加吊頂強制通風口或懸 掛管道系統回風口,回風口位於 熱通道上方。 IT 設備熱點的產生,製冷效率低下和不斷上升的 基礎設施成本。 上述很多資料中心忽略密封這些切口認為製冷不 足是導致過熱問題的根源,因此安裝額外的製冷 單元來消除過熱的問題。實際上,這些補償措施 都是不需要的 一個使額外的製冷容量的成本最小化的方法就是 封閉佈線切口安裝高架地板護孔環和墊圈可以增 加高架地板下的靜壓差。同時也會改善打孔地板 和地板柵格送風能力。 一項關於位置不當的回風格柵的調查 顯示,根本原因主要是:個人感覺一 些通道熱一些通道冷,認為這種條件 不當,試圖透過將冷氣口移到熱通道 並將熱氣口移到冷通道來加以調整。 設計合理的資料中心旨在達到最佳狀 況,即冷熱空氣分離,但人們卻認為 這是一種缺陷,他們會採取措施來混 合空氣,因而降低了系統性能並增加了 成本。這是一種誤解,其實熱通道就是為熱空氣而設計的。 當然,在構建資料中心時最容易安排和分配回風口。因此,在設計通風系統前,必須確保在機房 佈局中行的位置和方向分配合理。 施耐德電機 — 資料中心科研中心 第 49 號白皮書 版本 2 9 資料中心或網路機房內降低冷卻性能的可避免錯誤 表5 送風口與回風口設計缺陷後果總結 設計缺陷 熱回風位置不在熱通道上方 吊頂燈帶有回風口,且位於 冷通道上方 架空送風口在熱通道上方 熱通道中的通風地板地磚 熱點,特別是在機 櫃頂部 冷卻冗餘降低 熱點 冷卻冗餘降低 通風地板地磚附近無設備 架空送風口敞開,上方無設 備 高架地板內的外部孔用於管 道、線纜和通道 小 在高天花板區域,回風口位 置低 CRAC 容量降低 冷卻冗餘降低 透過策略 加以預防 TCO 後果 可用性後果 解決方案 電氣成本 降低了 CRAC 容量 加濕器維護 耗水量 將熱回風口置於熱通道上方 不要使用在冷通道上有回風口的 燈,或阻塞回風口 電氣成本 降低了 CRAC 容量 加濕器維護 耗水量 對於架空輸送,始終將送風口置 於冷通道上方 對於高架地板,送風口始終置於 冷通道中 電氣成本 降低了 CRAC 容量 封閉通風口,或在無設備的位置 打開 電氣成本 降低了 CRAC 容量 加濕器維護 耗水量 將吊頂用於回風口強制通風,或 延長管道以收集頂點的回風 按照本白皮書的指導,可以製造具有更高可用性、更少熱點、操作更經濟的新資料中心。其中描 述的一些技術可在現有資料中心實施,但其它技術在真實系統中不可行。當然,首先是盡可能避 免出現問題。APC 調查顯示,冷卻系統設計的大部分缺陷都是無心造成的,如果機構或 IT 人員瞭 解適當空氣分配對資料中心的性能、可用性和成本的重要性,則不會造成這些缺陷。制定規則可 以向相關各方有效傳達主要影響因素。 表6 資料中心設計規則建議 規則 理由 使用冷熱通道機櫃設計 冷熱空氣分離會減少熱點,改進容錯,並極大降低耗電量。眾所周知,如果所有機櫃行均朝向同一方向, 前面一行的廢熱將可能被輸入後面一行,從而會導致過熱,並極大降低空調性能。 在所有機櫃未使用的位 置使用盲板 盲板會防止設備的廢熱返回到設計進氣口,從而避免出現熱點,並延長設備壽命。所有伺服器和存儲製造 商都規定要使用盲板。 在活動地板地磚中所有 機櫃下方線纜孔使用密 封墊或刷 高架地板空氣分配系統旨在向設備進氣口提供冷空氣。這些進氣口位於機櫃前部。機櫃下方的開口會向設 備排氣口輸送冷空氣,並繞過設備,這會降低冷卻系統的性能。 不要試圖更正熱通道的 溫度。它們本應是熱 的。 熱通道旨在將廢熱與冷設備進氣口分離。任何消除此功能的企圖都會影響系統設計,降低設備可靠性,並 增加操作成本。從設備排出的氣本應很熱,熱通道旨在使熱空氣返回到空調系統。使熱通道保持熱量,有 助於確保冷通道的設備進氣口保持冷卻。 將機櫃標準化 機櫃支援冷卻系統的基本功能,不僅僅是機械支援。機櫃所具有的特性可防止廢熱進入設備進氣口,提供 適當的通風,提供無氣流阻塞的佈線空間,並使高密度附架冷卻設備的更新成為機櫃標準的組成部分。 將高密度設備分散佈置 在一個位置集中大功率設備會影響這些設備的運行,並會增加資料中心的操作成本。集中大功率設備會影 響送氣系統的容錯。整個資料中心溫度和濕度控制的改變可能會降低冷卻性能並增加冷卻成本。 施耐德電機 — 資料中心科研中心 第 49 號白皮書 版本 2 10 資料中心或網路機房內降低冷卻性能的可避免錯誤 制定規則可促進建議性討論。除了制定規則,透過信號或標記也可達到溝通目的。例如,在熱通 道中的機櫃後部作上標記,如圖 4 所示。IT 人員通常會將熱通道視為異常問題或缺陷。此標記有 助於他們瞭解為什麼資料中心的一個區域比另一個區域熱。 此處是熱通道 圖4 用於顯示熱通道用途的標記 結論 為了最大限度地提高 IT 設備的可用性,此通道應保持熱度。機架安排和消隱面板的 使用可防止設備廢氣返回到設備進氣口。這可降低設備工作溫度,延長設備壽命, 節省能量。 空氣分配系統作為資料中心的一部分,沒得到應有的理解和重視,設施操作員和 IT 人員通常會迫 於各方壓力對氣流採取措施,因而對可用性和成本造成無心的副面影響。 由於過去資料中心功率密度低,錯誤的氣流實施不會造成嚴重問題。然而近來功率密度的提高開 始需要測試冷卻系統的容量並增加熱點和冷容量的限制。 諸如將所有機櫃朝向同一方向等的決定,大多數情況下是出於美觀方面的考慮;但是隨著使用者 和客戶經驗更豐富,他們就會瞭解氣流的不當實施是無經驗的表現,有悖原設計意圖。 制定一系列簡單的規則,並提供簡單的理由,可使 IT 和實施人員達到有效溝通,從而最大限度提 高可用性和優化擁有權總成本(TCO)。 關於作者 Neil Rasmussen 是施耐德電機旗下 IT 事業部—APC 的高級創新副總裁。他負責為全球最 大的用於關鍵網路設備(電源、製冷和機櫃等基礎設施)科技方面的研發預算提供決 策指導。 Neil 擁有與高密度資料中心電源和製冷基礎設施相關的 19 項專利,並且出版了電源和 製冷系統方面的 50 多份白皮書,其中大多白皮書均以十幾種語言印刷出版。近期出版 的白皮書所關注的重點是如何提高能效。他是全球高效資料中心領域聞名遐邇的專 家。Neil 目前正投身於推動高效、高密度、可擴充資料中心解決方案專項領域的發展, 同時還擔任 APC 英飛系統的首席設計師。 1981 年創建 APC 前,Neil 在麻省理工學院獲得學士和碩士學位,並完成關於 200MW 電 源托克馬克聚變反應堆的論文。1979 年至 1981 年,他就職於麻省理工學院林肯實驗 室,從事飛輪能量儲備系統和太陽能電力系統方面的研究。 施耐德電機 — 資料中心科研中心 第 49 號白皮書 版本 2 11 資料中心或網路機房內降低冷卻性能的可避免錯誤 資源 點擊圖示打開相應 參考資源連結 利用氣流管理盲板改善機櫃冷卻效果 第 44 號白皮書 超高密度機櫃和刀鋒伺服器散熱策略 第 46 號白皮書 流覽所有 白皮書 whitepapers.apc.com 流覽所有 TradeOff Tools™ 權衡工具 tools.apc.com 聯絡我們 關於本白皮書內容的回饋和建議請聯絡: 資料中心科研中心 DCSC@Schneider-Electric.com 如果您是我們的客戶並對資料中心專案有任何疑問: 請與所在地區的 施耐德電機 銷售代表聯絡,或登錄: www.apc.com/support/contact/index.cfm 施耐德電機 — 資料中心科研中心 第 49 號白皮書 版本 2 12