隨著“新基建”進程的不斷推進,數字化轉型升級進度加快,數據中心作為未來經濟社會發展的戰略資源和數字基礎設施,在迎來爆發式增長的同時,其算力不均衡、能耗高、精細化管理不足等問題凸顯,數據中心高質量發展戰略已成為全行業深化數字化轉型的時代機遇。關于數據中心的高能耗問題,國內不同研究機構給出的年能耗值不盡相同,部分研究機構預測未來十年,國內數據中心耗電量將翻倍。事實上,隨著數據中心節能新技術的應用,盡管算力需求持續高比重增長,未來的數據中心的高耗能、高碳排放的情況未必會到達如此高的水平,但這并不意味著IT行業和決策者可以高枕無憂。數據中心的綠色節能低碳發展依然是值得關注的重點課題。2020年9月我國明確了“碳達峰、碳中和”目標,標志著中國對促進經濟高質量發展,社會繁榮和生態環境保護的決心。2021年2月,國務院發布《關于加快建立健全綠色低碳循環發展經濟體系的指導意見》,要求加快信息服務業綠色轉型,做好大中型數據中心、網絡機房綠色建設和改造,建立綠色運營維護體系。2021年6月國管局和國家發改委聯合發布的《“十四五”公共機構節約能源資源工作規劃》和同年11月由國家發改委、中央網信辦、工信部、國家能源局四部委發布的《貫徹落實碳達峰碳中和目標要求推動數據中心和5G等新型基礎設施綠色高質量發展實施方案》中均要求大型、超大型數據中心運行電能利用效率下降到1.3以下。2021年7月,工信部發布《新型數據中心發展三年行動計劃(2021-2023年)》,提出堅持綠色發展理念,支持綠色技術、綠色產品、清潔能源的應用,全面提高新型數據中心能源利用效率。隨著國家一系列政策的相繼頒布,數據中心綠色、低碳發展作為數據中心高質量發展戰略的重要部分應運而生。數據中心綠色、低碳發展通過創新節能技術提升設備的能效,充分利用可再生能源降低碳排放,進而推動數據中心作為數字化新基建的基礎性支撐作用,驅動社會實現節能降碳的目標。綠色數據中心旨在取得最大化的能源效率和最小化的環境影響,一般來說,包括數據中心的性能效率、環境影響、資源整合與能源統籌等方面。性能效率是基本要求,高可靠性的數據中心需要滿足GB50174《數據中心設計規范》中A級數據中心的要求。一方面要保持數據中心無故障持續運行,另一方面數據中心的IT系統、制冷、照明和電氣系統能夠保持穩定高效率運作。環境影響主要指數據中心在正常生產運行過程中對外部環境所帶來的影響。在建筑規劃和建設階段,應結合建筑的使用功能和規劃定位,對項目進行包括大氣、水、土壤、聲、固體廢棄物和生態的綜合環境影響評價。資源整合主要考察數據中心建設過程中的材料選擇、建造技術、設備或材料回收和可再生利用率及產品包裝等方面。能源統籌側重于數據中心運營后的能源管理、節能措施等方面。在現階段,綠色數據中心的評價主要是考慮其性能效率,兼顧數據中心運營后的能源統籌,提高整體能源使用效率。數據中心由于存在高發熱元件散熱瓶頸、資源利用率和能源效率低“三大難題”,所以其綠色節能亦非常重要,從國家到地方層面都對數據中心的能耗進行了引導和限制。
數據中心的主要耗能為IT設備、配電系統和暖通空調系統,見圖1。一個典型的數據中心,能耗主要由四大塊組成:第一大塊,是占數據中心總能耗約50%以上的IT設備系統,包括服務器設備、存儲設備和網絡通信設備等;第二大塊,是占數據中心總能耗約38%的空調系統,其中,空調制冷系統約占總功耗的25%,空調送、回風系統約占總功耗的13%;第三大塊,是占數據中心總能耗約10%的UPS供配電系統,其中UPS供電系統約占總功耗的5%,UPS輸入供電系統約占總功耗的1%;第四大塊,數據中心總功耗剩余的1%屬于輔助照明系統。由以上分析可以看出,數據中心的IT設備為最大的能源消耗,這一部分能耗最大的是以服務器為代表的計算設備,因此需要重點關注服務器能效的狀況。數據中心內暖通空調系統的能耗占數據中心總能耗約37%以上,該部分也被視為數據中心節能的極具潛力部分。供電系統的能耗約占數據中心總能耗的10%,主要來自于變壓器、UPS等供配電系統的轉換,其次是照明。因此數據中心的綠色節能,要從計算設備,例如服務器,暖通空調和電氣三個系統做出努力。
數據中心整體能源效率的提高離不開其各組成設備的能效提升,或者說提升設備的能效能夠直接有效提高數據中心的能效,例如提高服務器能效、減少供電損耗等,但設備級能效提高會遇到瓶頸,到了一定程度由于技術和成本的限制,其能效無法再次提高或者提高能效造成成本急劇上升。在設備能效提升遇到困難后,通常采用提高系統能效的方式,例如通過負載優化使服務器工作在高能效狀態,待機服務器進行優化;或者通過氣流組織分析,使制冷和空調散熱在時間和空間上進行匹配,因在系統能效的彈性比較大,通常從小的系統開始做起,逐漸引入更多變量,涉及的系統越來越多,同時再考慮管理因素,就成為從組織層面提高能效的方法和途徑。數據中心的本質作用是提供算力資源,并且數據中心能耗占比最大的是信息設備能耗,拋開計算能力,單純追求極低的電能使用效率(PUE)是不合理的。英特爾、三星、高通、英偉達等眾多半導體廠商紛紛發力,各種加速芯片百花齊放。XPU(CPU、GPU、DPU等各種服務器處理器的統稱)成為半導體芯片廠商競爭的新賽道,一條清晰的競爭主線也逐漸明顯——各大芯片企業都在構建自己的多元化產品能力。其中,英特爾基于XPU產品戰略,打造了從CPU到GPU、FPGA、IPU等多種異構算力資源,以XPU+oneAPI為抓手推動異構計算,打造從云到端的全面產品組合,涵蓋CPU、GPU、IPU、FPGA和專用ASICs等解決方案,解決了各種不同的處理器采用不同架構和不同指令集所造成的處理不同計算場景的不同表現,更好的應對計算的多元化,實現提供強大的計算力和足夠的靈活性的雙贏,并且在功耗、可靠性、體積等方面都有優勢,解決了通用計算在處理海量數據時采用更多處理器帶來的高昂成本和更高發熱量問題。服務器芯片算力的提升,計算場景的多元化對于數據中心節能至關重要。英特爾通過專用加速芯片大幅提升負載處理速度,也就是說同等工作量算的快。發力GPU和AI,提供更高計算密度和更快計算速度。其中,即將推出的代號為Arctic Sound-M(ATS-M)的英特爾數據中心GPU,能夠提供每秒150萬億次運算(150 TOPS)。首個旗艦級數據中心GPU—Ponte Vecchio,已經在復雜的金融服務應用以及AI推理和訓練工作負載方面展現出了卓越的優勢。于今年5月發布的專用于高性能深度學習AI訓練的Habana Gaudi2處理器,以及基于Xe HPC微架構且專為高性能計算和AI所設計的Ponte Vecchio GPU能夠通過支持多樣化架構,讓終端用戶充分利用處理器的高性能和高能效。
數據中心的能耗結構中,制冷空調系統的能耗僅次于信息設備能耗,如何降低數據中心的制冷能耗成為降低PUE的關鍵。隨著服務器單位功耗增大,原先尺寸的普通服務器機柜可容納的服務器功率往往超過15kw,在現有的風冷數據中心情形下,這已經到了空氣對流散熱能力的瓶頸。液冷技術作為一種散熱能力更強的技術,可以助力更高的功率密度。液冷技術指使用高比熱容、高傳熱系數的液體作為熱量傳輸的工質滿足服務器等IT設備散熱需求的冷卻方式。也就是說通過液體來替代空氣,把CPU、內存條、芯片組、擴展卡等器件在運行時所產生的熱量帶走。常見的液冷技術包括冷板式、浸沒式和噴淋式三種主要形式,液冷服務器可以接受更高的冷源供回水溫度,最大化的利用室外自然冷源,有效降低數據中心PUE至1.2以內。聯想基于新一代海神溫水水冷技術,以及第三代英特爾?至強?可擴展處理器,打造了聯想ThinkSystem SD650服務器,采用創新散熱技術提升性能,降低功耗。在上海交通大學打造了“思源一號”高性能計算集群,PUE可低至1.1左右,實現42%的節能減排。
液冷服務器雖然在散熱效率上有較大提高,但是由于標準化水平比較差,業界尚未有統一的設計規范,因此可靠性仍待提高,成本還需要降低。英特爾聚力攜手產業生態伙伴開放創新,構建液冷解決方案,在芯片、服務器、機架、數據中心四個水平方向進行研究,探索更經濟、更高效的冷卻方案設計參考,致力于提出冷板液冷系統設計相關的要求,以及未來液冷設計需要遵守的規范要求,為數據中心液冷方案設計與研究提供路徑與借鑒,通過產業伙伴共同提高冷板液冷技術關鍵部件的質量,共同促其標準化,降低設計與使用成本,從而推動建立并完善冷板液冷的生態系統促進整個產業的成熟度提高。
機柜級的節能技術主要包括:依據業務量、業務類型等引起的負載變化,進行功率的自動調整;采用完善的供配電方式,提升單機柜功率密度;提升計算密度,統一供電和共享散熱管理等技術措施。根據英特爾的實測數據顯示:使用機架備用電池消除計劃外峰值功耗,可將服務器上架率提高20%~30%。提升計算密度,通過增加母線電壓,適應大功率機架之需,可將電源效率提高2%,并提升機柜空間利用率,來綜合提升能效。模塊化設計貫徹綠色節能理念,實現統一供電、共享散熱管理。液冷冷板式散熱,搭配專業冷媒,覆蓋 CPU、內存等主要部件,整機PUE低至1.1,且能夠極大降低總體擁有成本。進行處理器功率控制調優,和根據業務負載自動調整功率,以及基于英特爾的開放處理器微代碼,調整主板與處理器電壓等舉措。實踐表明,這一方案顯著性提升了功率密度,可支持高達20kW的單機柜功率密度,實現算力的有效提升,即使采用純風冷,PUE 也可內控保持在1.2以下。此外,英特爾攜手中國電信共同推進AI節能技術部署,制冷系統節能率超23%,機房平均PUE從1.49降至1.38;同時,也聯合超聚變共同打造極簡架構高算力密度整機柜服務器,使制冷PUE低于1.1,單機柜支持144個高功耗CPU。合理的末端空調氣流組織是空調系統節能降耗的基礎和前提。提高精密空調的送回風溫度和冷源的供回水溫度一直是數據中心暖通系統節能的共識,但往往由于末端氣流不合理造成以上節能措施達不到理論上的高效節能目標。合理的氣流組織體現在數據中心機房內機柜進風區域空調冷氣流分布均勻,垂直和水平方向溫度場處于相對均衡狀態。可以借助相關風量、風速、溫度場測試儀器開展氣流組織的測量和評估,將抽象的氣流場參數化和具體化。通過測量技術的應用,探索數據中心機柜送風區域氣流組織與溫度場分布的耦合關聯,在完善氣流組織管理的基礎上,進行末端精密空調運行方式研究,通過測量優化,實現機柜進風區域溫度相對均衡分布,建立基于氣流組織優化的空調節能運行管理策略。最后,將氣流組織及空調節能管理策略AI智能化,保障測量、調優、管理和節能的精準控制。AI智能控制技術的應用有助于數據中心能效的提升,主要應用于供配電系統和制冷空調系統。增加對可再生能源的利用,是減少碳排放的關鍵步驟。英特爾已經開發出一項解決方案,可集成到現有的能源網基礎架構中,以打造出可適應不斷變化的能耗需求和能源來源的智能化水平更高的電網。英特爾聯合一些全球最大規模的公用事業運營商組建了智能二級變電站邊緣設備聯盟(Edge for Smart Secondary Substations Alliance),以實現電網變電站的現代化,并更好地支持可再生能源。法國最大的電網運營商Eenedis最近加入了這一聯盟,采用了提供全網實時控制的解決方案,對超過80萬個二級變電站進行了升級。為風能發電廠提供智能運營的北京金風慧能技術有限公司,通過利用英特爾AI解決方案、CPU集成AI加速,采用英特爾?DLBoost、Analytics Zoo,將風能預測的準確率從原先的59%提高到了79.41%。將AI智能控制技術應用于制冷空調系統的自動控制邏輯,通過預測室外氣象參數、分析負載變化情況、計算冷源設備特性,調優冷源系統控制邏輯,最大化地利用室外自然冷源,實現制冷系統的高效節能。高壓直流(HVDC)是為受人關注的技術,相比傳統的UPS減少了一個DC/AC逆變環節,使得電能利用效率大大提高,相比傳統UPS系統方案,其節能效果據測算最高可以提高8%。同時由于直流輸電導線根數少,沒有感抗和容抗的無功損耗,只有電阻的發熱損耗,提高了配電傳輸中的節能效果。直流輸電只需兩根導線,能夠節省大量線路投資,因此電纜費用省得多。影響數據中心能耗的因素涉及多方面,包括服務器系統、空調制冷系統、供配電系統、機房裝修、照明、變配電設備、供配電電纜等,甚至運行維護的水平都會影響到數據中心的能耗。通過對數據中心各子系統運行負荷和用能效率的分項監測、分析,發現各子系統運行中存在的耗能問題,有針對性的對各子系統進行運行調整和技術改進,降低數據中心電能消耗,提高整體能效。傳統數據中心采用人工或者人工與動環系統相結合的能耗分析方式,面對海量的運行數據和報表很難做到監控全面、預測精準、分析和控制到位。因此必須借助數據中心能耗分析工具,對數據中心的設備級、系統級以及項目級的能耗情況分級把控。比如英特爾研發的數據中心能耗分析工具,主要涵蓋監控、分析、預測和控制四個功能板塊。● 監控功能:帶網絡自動發現功能,支持多種設備和多種協議,支持各品牌設備,能夠跟蹤設備能耗變化趨勢;● 分析功能:及時發現機房內熱點,具備服務器能耗分析功能,識別空調制冷和氣流組織的不均衡問題,及時發現“僵尸服務器”,具備容量分析功能,實現智能容量管理;● 預測功能:容量增長預測,溫度健康預測,關聯應用的能耗和溫度預測;● 控制功能:服務器能耗控制策略,基于熱點的制冷分析,提高服務器機柜容量,基于溫度/功耗的應用遷移。基于數據中心能耗分析工具對各設備、系統運行狀況及能耗情況等數據信息的監控、分析和預測,及時發現問題,并制定精確的高效節能控制策略,依靠能耗分析工具的控制功能開展控制策略的實施,實現全面監控、精準預測分析和控制的全鏈條能耗管理策略。在數據中心業界廣泛使用CQC8302-2018《數據中心基礎設施運行與維護評價技術規范》中對能效管理有如下要求:1)制定能效管理制度,明確能耗數據的采集要求、采集方法及頻率,通過采集的數據進行系統分析,分析內容包括但不限于:
a.統計分析數據中心日耗電量及日平均耗電量情況;
b.統計分析數據中心能耗組成及占比;
c.統計分析數據中心月度能效指標變化情況;
d.統計分析UPS系統自身能耗變化情況;
e.統計分析空調暖通系統能耗變化情況;
2)統計分析數據中心耗水量變化情況(風冷系統選擇不適用),了解對IT 設備運行特征的狀況:
a. 是否對數據中心基礎設施所承載的到機柜顆粒度的IT設備運行峰谷期進行分析和了解;
b. 是否與客戶或用戶相關部門做好溝通,針對高密度IT負載的部署做出預測,并制定相關應對方案。
a. 應封堵設施建筑所有可能的漏風口,維持設施的正壓;
b. 應疏導設施內氣流的流向、封堵所有可能的漏風口、對機柜內所有空閑U位安裝盲板、關閉不必要的出風口、保證冷空氣的最佳使用效率。
5)基于安全性及運行效率的綜合考慮,建立運行閾值設定指南,設置監控報警閾值、空調回風溫度等。6)定期進行能耗分析會議,不斷完善及優化能耗管理策略。上述能效管理要求,如果采用手工的方式進行操作,將極大耗費人力,且很難持續符合要求,英特爾的數據中心能耗分析工具能夠協助數據中心運維人員持續滿足CQC8302-2018《數據中心基礎設施運行與維護評價技術規范》的要求。數據中心項目級別的能效管理,需要與組織的能源計量體系和能源管理體系結合在一起,融入數據中心運維體系之中,充分融合數據中心能耗分析工具和運行維護體系融合,在保證數據中心安全運行的基礎上,不斷尋求節能潛力,采用各種創新技術,提高整體的能效水平。雖然數據中心能源消耗量比較大,但整個數據中心能耗水平與提供的計算能力相比,增長并不多,其中主要得益于近年來服務器能效水平的提升。2020年2月28日發表在《科學》期刊的一篇論文,題目是《全球數據中心能源使用在需求快速增長下仍然放緩》。該論文研究計算出2010年至2018年間,全球數據中心需求增長了550%,數據中心能源使用僅增長了6%。因此對于數字經濟有重要作用的數據中心,仍然要大力發展。在大力建設數據中心的同時,注重節能低碳綠色技術的研究和應用,同時節能低碳技術需要與管理有機融合,共同驅動數據中心的高效節能。“三分建設,七分管理”已經是數據中心行業的共識,通過液冷技術、高效冷卻技術、高效芯片服務器等節能新技術的應用,配合精細化的運行維護管理,最終實現數據中心的綠色節能。
智能化技術的應用促進數據中心綠色高質量發展。AI智能控制技術能有效提高服務器運算效率、供配電效率和制冷能效,推動數據中心能效的提升。借助智能能耗分析工具,通過監控、分析、預測和控制等模塊功能的實施,實現各設備、子系統和項目級的能耗監測與控制,助力數據中心綠色高效發展。
因此,數據中心的綠色節能低碳發展不能單純的追求極低的電能使用效率(PUE),需要結合算力、IT設備能耗、暖通空調能耗、供配電能耗等多方面綜合考慮。數據中心綠色高質量發展具有社會層面的引領和表率作用。不僅會使高能耗產業快速轉變發展方式,加快千行百業的數字化轉型過程,實現快速節能降碳,同時,數據中心實現雙碳目標時采用的一系列先進技術和思路,為其他行業帶來啟發。通過技術遷移,這些思路可以幫助其他高耗能行業,包括農業、物流、采礦和制造等領域實現碳排放的減少,使這些行業在實現數字化轉型的同時,加速向碳中和轉型的步伐,從而實現數據中心綠色高質量發展,發揮更大的社會價值。
免責聲明:版權歸原作者所有,若有侵權,請聯系我們刪除.
上一篇:即插即用:模塊化數據中心的興起
下一篇:“東數西算”布局下,數據中心是如何建設的?這份數據中心建設要求請收好~