應(yīng)對人工智能數(shù)據(jù)中心的電力挑戰(zhàn)
國際能源署(IEA)的數(shù)據(jù)表明,2022 年數(shù)據(jù)中心的耗電量約占全球總用電量的 2%,達到 460 TWh 左右。如今,加密貨幣和人工智能/機器學習 (AI/ML) 等高耗能應(yīng)用方興未艾,而這些技術(shù)中通常需要部署大量的高性能圖形處理單元 (GPU)。因此,數(shù)據(jù)中心耗電量仍將不斷攀升。
人工智能應(yīng)用的擴展速度令人震驚。ChatGPT 上線僅 5 天,用戶數(shù)量就達到了 100 萬,并在 2 個月內(nèi)突破了 1 億,這一增長速度遠超于 TikTok 和 Instagram。GPT-4 訓(xùn)練包含超過 1.7 萬億參數(shù)和 13 萬億 token,總共使用了 2.5 萬個 NVIDIA A100 GPU,每臺服務(wù)器的功耗約為 6.5 kW。據(jù) OpenAI 稱,GPT-4 的訓(xùn)練耗時 100 天,消耗能源約 50 GWh,耗資 1 億美元。
在當前環(huán)境中,我們很難準確估計未來耗電情況,其中為支持人工智能而部署的GPU 消耗了大部分電力。國際能源署保守預(yù)測,到 2026 年,數(shù)據(jù)中心的耗電量將至少達到 650 TWh,甚至可能超過 1,000 TWh。
人工智能數(shù)據(jù)中心的架構(gòu)演變
早期數(shù)據(jù)中心將電網(wǎng)電壓集中轉(zhuǎn)換為12V,然后通過總線將電力傳輸至服務(wù)器,再通過邏輯電平轉(zhuǎn)換器將電壓轉(zhuǎn)換為 3.3/5V。然而功率需求不斷提升,這種供電方法的電能損耗變得不可接受。因此,母線電壓被提高到 48V,電流減小到原來的 1/4,損耗降低到了原來的 1/16。
而目前處理器電壓進一步降低,從3.3V 降到了低于 1V 的亞伏特級別,此時就需要使用多條功率相對較高的電壓軌。這進而催生了兩級電壓轉(zhuǎn)換方案。該方案使用 DC-DC 轉(zhuǎn)換器作為中間總線轉(zhuǎn)換器 (IBC),先將 48V 電壓轉(zhuǎn)換為 12V 的局部總線電壓,然后再將此轉(zhuǎn)換為所需的低電壓。
圖1:典型服務(wù)器電源架構(gòu) – 中間總線
人工智能數(shù)據(jù)中心需要高能效電源轉(zhuǎn)換
功率損耗帶來了雙重挑戰(zhàn),不僅會造成能源浪費、增加運營成本,而且會產(chǎn)生大量熱量,進而需占用更大空間、消耗更多成本。運營超大規(guī)模人工智能數(shù)據(jù)中心時,機架功率需求為120 kW。將電網(wǎng)電力轉(zhuǎn)換為 GPU 所用電壓的能效約為 88%,這意味著會產(chǎn)生大約 15 kW 廢熱,并需要通過液冷技術(shù)進行有效散熱。
在服務(wù)器電源設(shè)計中,能效和功率密度是兩個重要概念,二者相輔相成。我們必須盡可能高效地將來自電網(wǎng)的能量轉(zhuǎn)換為有用功率,減少損耗。為此,電源拓撲不斷演變,業(yè)界開發(fā)了同步整流等技術(shù),并在整流器中采用MOSFET 取代了損耗較大的二極管。
改進拓撲結(jié)構(gòu)只成功了一半。為了優(yōu)化能效,還必須盡可能提高所有元器件的能效,尤其是對轉(zhuǎn)換過程至關(guān)重要的MOSFET。
MOSFET 并非無損耗器件,在導(dǎo)通和開關(guān)過程中也會產(chǎn)生損耗。隨著服務(wù)器電源不斷提高運行頻率以縮小尺寸,開關(guān)損耗成為了優(yōu)化的重點。
高效PowerTrench? MOSFET
安森美(onsemi)的中低壓T10 PowerTrench?MOSFET采用了新型屏蔽柵極溝槽技術(shù),降低了開關(guān)損耗和導(dǎo)通損耗,并進而顯著降低了其Qg,RDS(ON) 也降至 1mOhm 以下。其中的先進軟恢復(fù)體二極管緩解了振鈴、過沖和噪聲問題,同時降低了 Qrr 損耗,為快速開關(guān)應(yīng)用找到了性能與恢復(fù)時間的平衡點。
與早期器件相比,這些新型MOSFET 可使開關(guān)損耗降低高達 50%,并使導(dǎo)通損耗降低 30% 以上。
圖2:PowerTrench? T10 MOSFET 的優(yōu)勢
安森美新型40V和80V T10 PowerTrench 器件的RDS(on) 表現(xiàn)出色。NTMFWS1D5N08X(80 V、1.43 mΩ、5 mm x 6 mm SO8-FL 封裝)和NTTFSSCH1D3N04XL(40 V、1.3 mΩ、3.3 mm x 3.3 mm 源極向下雙散熱封裝)具有優(yōu)異的品質(zhì)因數(shù)(FOM),是人工智能數(shù)據(jù)中心電源供應(yīng)器(PSU) 和中間總線轉(zhuǎn)換器應(yīng)用的理想選擇。T10 PowerTrenchMOSFET 符合嚴格的 Open Rack V3 能效標準,即能效達到 97.5% 以上。
提交
智能工控+存儲-星火存儲打造智慧存儲,助力產(chǎn)業(yè)創(chuàng)新
智能工控+存儲-金勝電子煥新品牌助力國產(chǎn)工控市場
?Saab UK 為深??碧綄崿F(xiàn)創(chuàng)新,降低潛水員及環(huán)境風險
CIMES 2024??怂箍?構(gòu)建智能制造生態(tài)系統(tǒng) 賦能行業(yè)數(shù)字化轉(zhuǎn)型
AVEVA劍維軟件在2024年倫敦科技周發(fā)布2023年度可持續(xù)發(fā)展進度報告與首份工業(yè)智能指數(shù)