實探中國電信臨港萬卡智算谷:推動AI產(chǎn)業(yè)生態(tài)集聚發(fā)展
中國電信臨港智算谷外景 本報記者 楊潔 攝
中國電信臨港智算谷機房 本報記者 楊潔 攝
隨著人工智能的發(fā)展,算力基礎(chǔ)設(shè)施加速迭代。近日,中國證券報記者跟隨中國電信舉辦的2024年投資者反向路演活動,走進中國電信臨港智算谷。
這里是長三角規(guī)模最大的運營商級算力資源池,也是國內(nèi)首個正式投入運營的國產(chǎn)單池萬卡液冷算力集群。目前,中國電信臨港智算谷一期正在向10萬卡的智算集群規(guī)模有序推進,終期規(guī)劃為30萬卡的高端智算集群。
“兩彈一優(yōu)”高標(biāo)準(zhǔn)示范
走進中國電信臨港智算谷一期A4機房,上千臺服務(wù)器“黑壓壓”整齊排列,在冷板式液冷等技術(shù)助力之下,實現(xiàn)了極致高密互聯(lián)部署。
相比風(fēng)冷,冷板式液冷散熱方式更高效。記者明顯感受到了機柜艙門內(nèi)外的溫差。據(jù)介紹,智算中心的平均PUE值達(dá)到國家新建數(shù)據(jù)中心1.25的標(biāo)準(zhǔn),部分區(qū)域更是低至1.08。
智算谷相關(guān)負(fù)責(zé)人介紹,這里是全國首個國產(chǎn)液冷萬卡集群,能夠為人工智能大模型訓(xùn)練、推理等工作提供強大的基礎(chǔ)設(shè)施支撐。
業(yè)內(nèi)人士表示,構(gòu)建萬卡智算集群,僅GPU的采購成本就高達(dá)幾十億元。擁有萬卡資源并不等于構(gòu)建了萬卡集群,多元異構(gòu)的GPU芯片,對智算集群的系統(tǒng)管理提出了更高、更復(fù)雜的要求。
例如,為應(yīng)對智算算力在供電、散熱方面的挑戰(zhàn),智算谷創(chuàng)新采用“兩彈一優(yōu)”(即彈性供電、彈性制冷、氣流組織優(yōu)化)的方式,實現(xiàn)了隨需應(yīng)變的彈性能力。
數(shù)字信息基礎(chǔ)設(shè)施持續(xù)演進升級,以滿足人工智能發(fā)展需求。中國電信規(guī)劃并建設(shè)全國“2+3+7+X”公共智算云池,在京津冀、長三角建設(shè)國內(nèi)領(lǐng)先的萬卡全液冷智算集群,在廣東、江蘇等5省打造千卡資源池,滿足AI訓(xùn)練、推理需求。截至上半年末,中國電信智算總規(guī)模達(dá)到21EFLOPS,算力總規(guī)模持續(xù)領(lǐng)先。
中國電信堅持“兩彈一優(yōu)”,積極推進數(shù)據(jù)中心向AIDC升級。針對智能算力異構(gòu)和分散化等問題,中國電信率先提出基于長距無損智算網(wǎng),構(gòu)建分布式智算集群,突破單體智算中心的算力、空間、供電等資源限制。
算力集群將進一步擴容
中國電信臨港智算谷是上海臨港算力產(chǎn)業(yè)版圖中的重要部分,可為臨港乃至整個上海數(shù)字經(jīng)濟發(fā)展提供強大支撐。
據(jù)了解,上海臨港新片區(qū)已經(jīng)形成8個高能級智算中心,批復(fù)的機架數(shù)超4.15萬個,已建成的機架數(shù)超2.35萬個。按照臨港新片區(qū)的規(guī)劃,未來將進一步擴容算力集群,力爭2025年算力產(chǎn)業(yè)總體規(guī)模提升至100億元。
智算谷項目一期占地119畝,規(guī)劃建設(shè)10萬卡高端智算集群,2023年9月1.1期投產(chǎn),2024年9月1.2期兩棟機樓成功封頂,具備機電進入條件。
未來,中國電信將持續(xù)構(gòu)建高質(zhì)量算力供給體系,以綠色低碳、超大規(guī)模、超高性能算力底座,推動開放、共贏、可持續(xù)的AI產(chǎn)業(yè)生態(tài)發(fā)展,打造具有國際影響力的人工智能產(chǎn)業(yè)生態(tài)集聚區(qū)。