[中國,銀川,2023年8月18日]在第二屆“西部數(shù)谷”算力產(chǎn)業(yè)大會期間,主題為“算融星光,網(wǎng)聚銀河”的算網(wǎng)融合分論壇同步舉辦。本論壇匯聚眾多位工程院院士、國內(nèi)算力領域的頂尖專家、學者,共同探討新形勢下,算力前沿技術未來的發(fā)展趨勢。華為數(shù)據(jù)通信產(chǎn)品線數(shù)據(jù)中心網(wǎng)絡領域副總裁張白發(fā)表了主題為《華為星河AI網(wǎng)絡,高運力釋放AI時代高算力》的演講。
華為數(shù)據(jù)中心領域副總裁張白發(fā)表主題演講
張白表示:“自2020年至今,AI掀起了科技新熱潮,ChatGPT的出現(xiàn)無疑加速了AI發(fā)展的步伐,大模型引領AI進入新的發(fā)展階段。大模型訓練是個復雜的系統(tǒng)工程,網(wǎng)絡基礎設施是長穩(wěn)訓練的關鍵之一。華為提出星河AI網(wǎng)絡,融合運得多、運得快、運得穩(wěn),三大優(yōu)勢,為客戶提供大規(guī)模、高吞吐、高可靠的網(wǎng)絡建設,釋放AI時代高算力!”
運得多:大帶寬,大組網(wǎng)
首先,AI場景中大模型是未來的趨勢,適配萬卡集群是網(wǎng)絡最基本的要求,華為打造端到端200GE/400GE設備構(gòu)建大帶寬AI無損網(wǎng)絡,4倍于業(yè)界規(guī)模,完美匹配AI場景訴求,支撐網(wǎng)絡運得多。
運得快:高吞吐,性能加速
其次,華為采用算網(wǎng)一體化的方式部署,效率可以提升10倍以上,整個過程自動校驗0配置差錯,大大縮減了時間和人力成本。獨創(chuàng)AI網(wǎng)絡加速器,大大提高網(wǎng)絡吞吐,以圖片處理為例,傳統(tǒng)場景每秒只能處理2330張圖片,而華為網(wǎng)絡每秒可以處理2924張圖片,訓練效率提升了20%,保障網(wǎng)絡運得快。
運得穩(wěn):月級訓練不中斷
最后,AI訓練實際上不會一路暢通,大規(guī)模高性能網(wǎng)絡的運維也是一大難題,華為采用智能化運維保證訓練全程實時可視,分鐘級識別慢主機(丟包、超時延),保障集群持續(xù)穩(wěn)定運行,月級訓練無中斷,護航網(wǎng)絡運得穩(wěn)。
華為星河AI網(wǎng)絡,通過網(wǎng)絡控制器、網(wǎng)絡、計算強強聯(lián)手實現(xiàn)算網(wǎng)一體融合,實現(xiàn)算力網(wǎng)絡“運得多,運得快,運得穩(wěn)”的目標,高運力釋放AI時代高算力!論壇上,中國通信院云大所所長何寶宏也對此方案能力表達了深切認可。
目前,華為星河AI網(wǎng)絡已在全球100+企業(yè)部署商用。面向未來,華為將繼續(xù)攜手客戶和伙伴一起推動AI大模型創(chuàng)新變革,通過行業(yè)實踐和驗證加快AI產(chǎn)業(yè)化落地,引領社會發(fā)展的新進程。