安全和綠色是數(shù)據(jù)中心發(fā)展的主方向

2024-03-20  瀏覽量:1060


按照數(shù)字技術的發(fā)展技術,未來數(shù)據(jù)中心將具備安全可靠、融合極簡、低碳綠色三大特征,具體到設備產(chǎn)品、數(shù)據(jù)系統(tǒng)和架構方面,也將呈現(xiàn)出不同的技術演進趨勢。

  

數(shù)據(jù)顯示,從2019年到2022年,數(shù)據(jù)中心業(yè)務中斷造成損失超過100的事件比例從40%上升至70%,且會隨著算力需求增長比例不斷升高。毫無疑問,安全可靠是數(shù)據(jù)中心的核心訴求,應始終作為最高優(yōu)先級關注。同時,隨著AI大時代的來臨,數(shù)據(jù)中心將從云數(shù)據(jù)中心向“云+智算中心”演進。未來,數(shù)據(jù)中心將具備安全可靠、融合極簡、低碳綠色三大特征,具體到設備產(chǎn)品、數(shù)據(jù)系統(tǒng)和架構方面,也將呈現(xiàn)出不同的技術演進趨勢。我們預測,在2024年,數(shù)據(jù)中心的發(fā)展將出現(xiàn)以下新變化。

  

高可靠產(chǎn)品+專業(yè)化服務是保障數(shù)據(jù)中心安全可靠運行的關鍵

  

數(shù)據(jù)中心承載著海量數(shù)據(jù)的存儲、處理和傳輸任務,為各行各業(yè)的各種系統(tǒng)穩(wěn)定運行提供保障,但數(shù)據(jù)中心的安全性、可靠性一直是較薄弱的環(huán)節(jié)。為確保數(shù)據(jù)中心能夠安全可靠地運行,我們在產(chǎn)品設計、生產(chǎn)環(huán)節(jié)就要貫穿“全產(chǎn)業(yè)鏈安全”的理念,同時嚴控產(chǎn)線質量,實現(xiàn)高度自動化,減少人為干預,保障產(chǎn)品自身的高可靠性。此外,我們還要大膽假設,充分思考產(chǎn)品出現(xiàn)問題后應采取的應對措施,通過提供專業(yè)化部署和運維服務,降低產(chǎn)品失效率,減輕災后影響,完善端到端的保障機制,以保障數(shù)據(jù)中心安全可靠運行。

  

分布式制冷架構將是保障溫控安全的優(yōu)選項

  

傳統(tǒng)大型數(shù)據(jù)中心多采用集中式制冷架構,如傳統(tǒng)冷凍水系統(tǒng),該系統(tǒng)中的冷凍站包括七大子系統(tǒng)和上百種設備,各設備之間不能獨立運行,一旦發(fā)生單點故障,可能會影響整個冷凍站的安全運行,進而導致數(shù)據(jù)中心大規(guī)模宕機。近年來,業(yè)內(nèi)部分數(shù)據(jù)中心發(fā)生的多起安全事故也印證了集中式制冷架構存在單點故障的風險。相比之下,分布式制冷架構靈活,各子系統(tǒng)相互獨立,單臺設備故障不會影響其他設備運行,故障更小,可靠性更高,能直接從架構設計上避免數(shù)據(jù)中心制冷系統(tǒng)單點運行的潛在風險,提升數(shù)據(jù)中心的運行可靠性。

  

預測性維護模塊將成為數(shù)據(jù)中心基礎設施的標配

  

數(shù)據(jù)中心的維護往往屬于事后型維護,發(fā)生事故后才知道問題所在,但隨著智算時代的到來,數(shù)據(jù)中心的故障響應時間將大幅縮短。未來,在數(shù)據(jù)中心基礎設施的運維方面,預測性維護模塊將成為標配,維護從事后型轉為事前型。得益于AI技術的快速發(fā)展,預測性維護的范圍將持續(xù)擴大,從電容、風扇等易損件的使用壽命預測到設備的熱失控預警再到制冷系統(tǒng)的漏液預警,這些都能實現(xiàn)前置,從被動“救火”走向主動“防火”,在運維層面大幅提升數(shù)據(jù)中心的可靠性。

  

全生命周期的網(wǎng)絡安全防護體系將成為數(shù)據(jù)中心基礎設施的保護盾

  

隨著數(shù)字化、智能化程度的加深,網(wǎng)絡安全風險也在升級,網(wǎng)絡攻擊變得越來越常態(tài)化。UPS電源、空調設備等一旦遭遇惡意攻擊,會直接影響數(shù)據(jù)中心的安全性、可靠性。未來,在數(shù)據(jù)中心基礎設施層面,“硬件安全+軟件安全”才是全方位的安全策略,尤其是針對軟件安全,我們需要從供應安全、縱深防御、運維/運營安全三個維度考慮,構筑全生命周期網(wǎng)絡安全防護體系,為數(shù)據(jù)中心的安全可靠運行保駕護航。

  

預制化、模塊化將成為數(shù)據(jù)中心高質量快速交付的優(yōu)選項

  

互聯(lián)網(wǎng)云廠商的全球業(yè)務加速發(fā)展,帶動了數(shù)據(jù)中心建設需求顯著增長。但在傳統(tǒng)的建設模式下,數(shù)據(jù)中心建設速度慢、工程復雜,不能很好地滿足用戶快速部署的需求。因此,建設周期更短、質量更高的預制化、模塊化方案將成為首選。企業(yè)通過“工程產(chǎn)品化”和“產(chǎn)品模塊化”方案,在工廠一體化集成數(shù)據(jù)中心的軟硬件,并完成預制和預調試,保證現(xiàn)場交付的是高質量產(chǎn)品,這樣既能有效縮短交付周期,也可以滿足客戶業(yè)務快速上線的需求。

  

專業(yè)化管理平臺讓數(shù)據(jù)中心運維更加安全和高效

  

從千柜級建筑到萬柜級園區(qū),數(shù)據(jù)中心越來越呈現(xiàn)出規(guī)模化、集約化的發(fā)展趨勢,相應的整體運維復雜度也大幅提升,且數(shù)據(jù)中心設備多為聾啞”設備,若使用傳統(tǒng)巡檢方法,不僅難度大,對運維人員技能的要求也較高,會導致故障定位時間長。構建專業(yè)化的管理平臺可以顯著提升數(shù)據(jù)中心運維工作的效率和準確性,幫助客戶構建設備深度管理能力,做到快速判斷問題、及時排除故障,確保數(shù)據(jù)中心安全穩(wěn)定運行。

  

風液融合將成為業(yè)務需求不確定場景下的優(yōu)選架構

  

當前正處于通用算力和智能算力交替的過渡期,同一個數(shù)據(jù)中心同時存在通用算力和智能算力應用場景。通用服務器單柜功率密度一般不超過15kW,風冷型設備即可滿足其制冷散熱需求,而智算中心單柜功率密度通常超過30kW,這種場景往往需要液冷設備來散熱。對于需求不確定的業(yè)務場景,風液融合將成為適配未來數(shù)據(jù)中心演進路徑的優(yōu)選架構,它能夠發(fā)揮“風冷+液冷”組合比例可調的優(yōu)勢,靈活應對業(yè)務需求變化。

  

間接蒸發(fā)冷卻依然是未來的優(yōu)選制冷方案

  

當前,風冷方案仍占據(jù)著主流的數(shù)據(jù)中心應用場景。在冷源側,相較于冷凍水系統(tǒng),間接蒸發(fā)冷卻方案在架構、效率和運維方面存在明顯優(yōu)勢,是未來較為經(jīng)濟適用的制冷方案。間接蒸發(fā)冷卻的分布式制冷架構可有效避免單點故障,可靠性更高,并且它能充分利用自然冷源,僅需完成一次熱交換,在寒冷地區(qū)絕大部分時間無需壓縮機制冷,達到了很低的PUE(數(shù)據(jù)中心能源效率評價指標)。此外,針對智能算力未來發(fā)展的液冷降溫需求,間接蒸發(fā)冷卻方案也能提供很好的技術支撐。

  

能效PUE挖潛要從關注部件效率調整轉為關注系統(tǒng)工程優(yōu)化

  

傳統(tǒng)數(shù)據(jù)中心更關注提升UPS電源、空調等部件的效率,但因元器件的物理限制,部件的效率提升已接近瓶頸,微調改進的時間和成本較高,無法滿足算力爆發(fā)時代的巨大需求。因此,提升數(shù)據(jù)中心能效需要轉換思路,我們要從關注部件效率調整轉為關注系統(tǒng)工程優(yōu)化,用系統(tǒng)工程思維綜合審視,在現(xiàn)實條件限制和部件技術水平提升間進行權衡,得出最優(yōu)解,如UPS電源雙變換模式轉向S-ECO(智能在線模式),可以助力我們進行端到端的數(shù)據(jù)中心能效優(yōu)化。

  

AI調優(yōu)將成為實現(xiàn)存量數(shù)據(jù)中心能效智能優(yōu)化的首選項

  

在數(shù)據(jù)中心節(jié)能方面,除了新建的數(shù)據(jù)中心,仍有大量存量數(shù)據(jù)中心的PUE值遠高于國家一體化大數(shù)據(jù)中心建設的要求,迫切需要進行節(jié)能改造。傳統(tǒng)的節(jié)能改造需要停線停業(yè)務,存在業(yè)務中斷的風險,而采用人工調整優(yōu)化的方式難度大、效果差、頻率低。相比之下,AI能效調優(yōu)解決方案能夠通過預置AI算法和大數(shù)據(jù)模型,對存量數(shù)據(jù)中心實現(xiàn)節(jié)能優(yōu)化,且AI調優(yōu)不依賴人工經(jīng)驗,優(yōu)化速度快、效果好,可以很好地實現(xiàn)從“制冷”到“智冷”的轉變。

  


上一條:革新數(shù)據(jù)中心的技術趨勢 下一條:如何預防機房火災隱患?