國產(chǎn)AI算力需求暴漲,神州鯤泰中標電信AI集采,加速AI算力與產(chǎn)業(yè)融合
隨著(zhù)生成式人工智能的迅速發(fā)展,催生出大量新場(chǎng)景、新業(yè)態(tài)、新模式,引發(fā)智能算力需求爆發(fā)式增長(cháng),AI算力已經(jīng)成為推進(jìn)發(fā)展新質(zhì)生產(chǎn)力的重要引擎,對以云網(wǎng)融合為核心特征的數字信息基礎設施提出更高的要求。根據中國電信發(fā)布的《AI算力服務(wù)器(2023-2024年)集中采購項目》顯示,本次集采規模超80億元,包括AI服務(wù)器4175臺以及IB交換機1182臺,其中國產(chǎn)算力占整體采購數量的47.35%。其中神州鯤泰系列服務(wù)器入選標包3和標包4(風(fēng)冷、液冷智算服務(wù)器),中標金額超1.1億元。
算網(wǎng)融合,構筑堅實(shí)的算力基礎
近年來(lái),中國電信持續推動(dòng)數字信息基礎設施演進(jìn)升級,規劃并建設全國“2+3+7+X”公共智算云池,在京津冀、長(cháng)三角建設國內領(lǐng)先的萬(wàn)卡全液冷智算集群,在廣東、江蘇等5省打造千卡資源池,滿(mǎn)足AI訓推需求,截至目前,中國電信智算總規模達到21EFLOPS。
打造算網(wǎng)融合的公共智算云池,需要將運營(yíng)商核心網(wǎng)絡(luò )池化升級,神州鯤泰智算服務(wù)器搭載“鯤鵬+昇騰”處理器,通過(guò)標準的IT虛擬化技術(shù),把網(wǎng)絡(luò )設備統一到工業(yè)化標準的高性能、大容量的服務(wù)器、交換機和存儲平臺上,建立統一體系,實(shí)現軟硬件標準的統一并充分解耦,模塊化的軟硬件搭配能形成更靈活的配置。神州鯤泰打造的眾核架構以及虛擬化技術(shù)生態(tài),幫助運營(yíng)商客戶(hù)將多個(gè)物理服務(wù)器資源整合到單一物理服務(wù)器上,有效實(shí)現了資源的共享和高效利用。神州鯤泰通過(guò)匹配運營(yíng)商客戶(hù)統一的算力封裝標準,形成自動(dòng)化的算力感知與狀態(tài)傳播,有效適應不同業(yè)務(wù)規模和需求的變化,充分響應數字時(shí)代AI業(yè)務(wù)靈活多變的實(shí)際需求。
在神州鯤泰智算服務(wù)器的支持下,電信加速推動(dòng)數據中心向AIDC升級,強化智算中心對算力資源的彈性部署,針對智能算力異構和分散化等問(wèn)題,構建分布式智算集群,突破單體智算中心的算力、空間、供電等資源限制,為跨地域、跨層級、跨主體的算力協(xié)同調度奠定基礎。
靈活調度,打造一體化智算服務(wù)平臺和運營(yíng)體系
在打造算力基礎設施的前提下,中國電信正全面升級自身的智能云能力體系,加快構建一體化智算服務(wù)體系和能力,提供強大的算網(wǎng)調度能力、高效的異構計算能力、一站式的訓推服務(wù)能力和豐富的落地應用,推動(dòng)算網(wǎng)調度、技術(shù)架構、訓練推理和資源管理等“四個(gè)一體化”的發(fā)展。
為有效應對運營(yíng)商多云異構的智算需求,神州鯤泰打造異構智算調度運營(yíng)平臺HISO、異構智算加速平臺HICA,幫助高效管控在多云異構環(huán)境下的算力資源調度。其中異構智算調度運營(yíng)平臺HISO能實(shí)現GPU資源虛擬化或池化,完成跨集群之間的算力調度;異構智算加速平臺HICA解決集群內部的算力調度優(yōu)化問(wèn)題,幫助客戶(hù)在多云異構環(huán)境下顯著(zhù)提升算力使用效率。在項目的前期適配中,神州鯤泰智算系列服務(wù)器能快速完成對客戶(hù)算力調度平臺的適配工作,通過(guò)算數協(xié)同、多級調度等技術(shù),有效推動(dòng)異構算力的標準化接入納管,促進(jìn)一體化算力調度體系加速形成。從而在面向行業(yè)大模型訓推場(chǎng)景時(shí),能通過(guò)一站式智算服務(wù)實(shí)現大模型訓推,將訓練效率提升50%,推理效率提升28%,并通過(guò)全鏈路監控保障訓練質(zhì)量。
綠色智算,節能環(huán)保
隨著(zhù)各種高性能芯片的發(fā)展,導致數據中心熱流密度明顯升高,而電子器件失效的主要原因就是溫度過(guò)高,高能耗導致高故障,散熱需求推動(dòng)液冷解決方案的發(fā)展。值得注意的是,此次采購中液冷服務(wù)器作為單獨標包進(jìn)行集采且份額不小,體現出液冷技術(shù)在智算中心建設中的重要性正在提升,液冷技術(shù)及解決方案有望迎來(lái)新發(fā)展。
神州鯤泰此次提供的產(chǎn)品中包含液冷解決方案服務(wù)器,通過(guò)一體化冷板,智能流量調節來(lái)提升系統的散熱效率,采用負壓管線(xiàn)系統,漏液近端探測技術(shù),并聯(lián)動(dòng)服務(wù)管控系統提升冷卻系統的可靠性,有效降低30%的節點(diǎn)能耗。而為了幫助客戶(hù)規避接口多、接頭復雜、現場(chǎng)實(shí)施部署難度大、實(shí)施周期長(cháng)等難題。通過(guò)采用一體化交付方式,神州鯤泰液冷解決方案產(chǎn)品在有效降低部署和運維的復雜度的同時(shí),還能實(shí)現100%全液冷及高性?xún)r(jià)比液冷方案,助力數據中心PUE邁向1.15,并且憑借60KW+的最大單柜功率,實(shí)現1.5倍于行業(yè)平均水平的能效比,在為客戶(hù)提供強大算力的同時(shí)有效控制能耗成本。
數字信息基礎設施為人工智能提供了充足的計算、存儲和網(wǎng)絡(luò )資源,承載了豐富算法模型和海量高質(zhì)量數據,支持人工智能應用與場(chǎng)景快速對接,加速數據要素匯聚流通。神州鯤泰智算服務(wù)器正在幫助運營(yíng)商客戶(hù)打造更大帶寬、更高速率、更低時(shí)延、更加可靠和更大彈性的算力網(wǎng)絡(luò ),借助鯤鵬處理器以及昇騰AI處理器的能力,加速AI算力與產(chǎn)業(yè)應用融合,持續推動(dòng)數據要素價(jià)值釋放。