日前,開放計(jì)算標(biāo)準(zhǔn)工作委員會(huì)(OCTC)和OCP中國(guó)社區(qū)聯(lián)合主辦了“面向應(yīng)用的服務(wù)器算效標(biāo)準(zhǔn)與評(píng)估”開放計(jì)算技術(shù)沙龍。活動(dòng)匯聚了中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院、中石油、中移動(dòng)、快手、浪潮信息、AMD、Intel、海光信息等研究機(jī)構(gòu)、知名企業(yè)的產(chǎn)學(xué)研專家和行業(yè)領(lǐng)袖,對(duì)不同應(yīng)用下算力需求范式變化、面向應(yīng)用的算力算效評(píng)估指標(biāo)體系構(gòu)建、提升服務(wù)器性能及能效的前沿技術(shù)等話題進(jìn)行了精彩分享和激烈討論。
智能時(shí)代計(jì)算范式改變,亟需構(gòu)建面向?qū)嶋H應(yīng)用的算力算效評(píng)價(jià)基準(zhǔn)
智能時(shí)代,從智慧醫(yī)療、智能客服、自動(dòng)駕駛到智能制造,不同行業(yè)、不同場(chǎng)景的人工智能應(yīng)用,不僅帶來了算力需求的指數(shù)級(jí)增長(zhǎng),也推動(dòng)了算力發(fā)展范式的變革。以往,以CPU為主的時(shí)代,大家追求的是彈性、高效、性價(jià)比,然而智能時(shí)代,新興場(chǎng)景帶來了差異化的算力需求,傳統(tǒng)以CPU基礎(chǔ)性能為主的評(píng)測(cè)基準(zhǔn)已不再適用,亟需構(gòu)建面向?qū)嶋H應(yīng)用的算力算效評(píng)價(jià)基準(zhǔn)。
OCTC秘書長(zhǎng)陳海
以應(yīng)用為中心,推動(dòng)算力產(chǎn)業(yè)構(gòu)建AI時(shí)代下服務(wù)器算力算效評(píng)估標(biāo)準(zhǔn)。
在AI和大模型的驅(qū)動(dòng)下,算力產(chǎn)業(yè)從技術(shù)、產(chǎn)品到應(yīng)用場(chǎng)景的變化趨快,同時(shí),國(guó)家政策、行業(yè)及用戶對(duì)能效和算效的要求亦日益攀升。這就亟需建立適用多場(chǎng)景的服務(wù)器算效、能效評(píng)價(jià)的標(biāo)準(zhǔn)化方案,以確保測(cè)評(píng)結(jié)果精準(zhǔn)對(duì)接用戶實(shí)際需求,為用戶、行業(yè)和廠商提供客觀、準(zhǔn)確、完整的評(píng)價(jià)體系。
中國(guó)石油集團(tuán)東方地球物理公司處理中心原總工程師,教授級(jí)高級(jí)工程師賴能和
油氣行業(yè)智能化轉(zhuǎn)型推動(dòng)算力需求多樣化發(fā)展,算力性能評(píng)估需要關(guān)注服務(wù)器在不同應(yīng)用中計(jì)算精度、網(wǎng)絡(luò)架構(gòu)、存儲(chǔ)和IO系統(tǒng)的平衡以及能效等。
石油產(chǎn)業(yè)鏈長(zhǎng),從勘探開發(fā)的地震數(shù)據(jù)初至波拾取、煉油化工的生產(chǎn)線控制系統(tǒng)到智慧加油站的銷售系統(tǒng),擁有豐富的智能化場(chǎng)景。隨著油氣行業(yè)智能化轉(zhuǎn)型的推進(jìn),應(yīng)用也在從“高精尖”傳統(tǒng)應(yīng)用向新興多應(yīng)用場(chǎng)景拓展,算力需求從高性能計(jì)算,向高性能數(shù)據(jù)分析和ML /DL實(shí)時(shí)計(jì)算的AI算力演化,需要面向不同應(yīng)用場(chǎng)景,針對(duì)計(jì)算精度、網(wǎng)絡(luò)架構(gòu)、存儲(chǔ)和IO系統(tǒng)的平衡設(shè)計(jì)等進(jìn)行服務(wù)器系統(tǒng)設(shè)計(jì)和應(yīng)用評(píng)估,對(duì)算力供給的多元化,高能效與綠色低碳提出了更高的要求。
中移動(dòng)信息技術(shù)有限公司項(xiàng)目經(jīng)理李圣義
以科學(xué)、系統(tǒng)的評(píng)估方法來選擇適合業(yè)務(wù)需求的服務(wù)器
運(yùn)營(yíng)商行業(yè)具有應(yīng)用場(chǎng)景多樣、多算力并行的業(yè)務(wù)特征,需要科學(xué)、系統(tǒng)的評(píng)估方法來選擇更適合業(yè)務(wù)需求的服務(wù)器,確保投資的有效性。中國(guó)移動(dòng)一直對(duì)算力算效評(píng)測(cè)標(biāo)準(zhǔn)進(jìn)行積極探索,通過業(yè)務(wù)場(chǎng)景分類、芯片性能評(píng)估、系統(tǒng)性能評(píng)估、系統(tǒng)功耗評(píng)估等一系列技術(shù)手段,對(duì)服務(wù)器算力輸出能力進(jìn)行綜合分析,為服務(wù)器選型、設(shè)備利舊等提供衡量參考。
以系統(tǒng)視角全面優(yōu)化,加速服務(wù)器算力算效的升級(jí)
隨著技術(shù)的飛速發(fā)展和應(yīng)用場(chǎng)景的持續(xù)拓展,對(duì)服務(wù)器的算力和算效需求正日益攀升,這不僅意味著硬件層面的升級(jí),比如采用性能更強(qiáng)的處理器和更先進(jìn)的存儲(chǔ)解決方案,也涉及到軟件層面的深度優(yōu)化和系統(tǒng)設(shè)計(jì)的創(chuàng)新,在OCP中國(guó)社區(qū)負(fù)責(zé)人葉毓睿主持的“服務(wù)器算效提升及行業(yè)應(yīng)用”圓桌討論環(huán)節(jié),嘉賓從技術(shù)、應(yīng)用和系統(tǒng)等不同層面,分享了關(guān)于服務(wù)器的算效、能效提升的前沿技術(shù)思考與展望。
AMD服務(wù)器資深系統(tǒng)架構(gòu)師周景瑜認(rèn)為,面向應(yīng)用,芯片計(jì)算架構(gòu)的創(chuàng)新需關(guān)注內(nèi)存、IO等諸多要素。過去20年里,標(biāo)準(zhǔn)服務(wù)器的性能基本上每2.4年會(huì)翻一倍。而GPU服務(wù)器則每2.1年性能提升一倍。服務(wù)器計(jì)算效率的持續(xù)提升主要源于三大因素:一是整機(jī)制程,從28納米演進(jìn)至當(dāng)前的3納米,芯片廠商可以在制程迭代,微架構(gòu)優(yōu)化、及封測(cè)方面展開合作,進(jìn)一步提高每瓦特的性能;二是CXL技術(shù),通過支持CXL 3.1打破內(nèi)存墻,提高了核存比;三是IO,未來趨勢(shì)是減少外部數(shù)據(jù)溝通成本,使用光纖方式傳輸數(shù)據(jù)來提升能效比。
賴能和表示,油氣行業(yè)用戶在評(píng)估服務(wù)器的性能、能效和計(jì)算效率時(shí),需要綜合考量多種因素,不應(yīng)僅僅關(guān)注單臺(tái)服務(wù)器或工作站的性能,而應(yīng)更加重視整個(gè)系統(tǒng)的性能表現(xiàn)。同時(shí),網(wǎng)絡(luò)連接技術(shù)對(duì)于提升計(jì)算性能具有重要作用。隨著處理器核心數(shù)量的不斷增加,算力大幅提升,但未必對(duì)所有應(yīng)用都能達(dá)到線性增加,有些并行計(jì)算,當(dāng)核心數(shù)量達(dá)到一定數(shù)量后,對(duì)并行計(jì)算性能效率會(huì)有所影響,因此需要從系統(tǒng)架構(gòu)和應(yīng)用優(yōu)化兩個(gè)層面進(jìn)行調(diào)整優(yōu)化。
快手IDC系統(tǒng)架構(gòu)師楊琪表示,針對(duì)數(shù)據(jù)中心的算力算效與能效的平衡,PUE不一定是唯一的參考標(biāo)準(zhǔn)。對(duì)用戶而言,算力提升意味著能加快成果的產(chǎn)出,但有可能會(huì)帶來更高的能耗。高算力與低能耗之間的博弈,可能影響數(shù)據(jù)中心的整體收益,需要業(yè)界更深入的探討,比如數(shù)據(jù)中心的液冷供水溫度設(shè)定,從35℃降低至25℃,低水溫雖然可能帶來PUE的升高,但是算效也可能提高了,這就需要進(jìn)一步的綜合評(píng)估對(duì)比收益是否增加。因此,將算力、算效與PUE結(jié)合納入考量指標(biāo)是未來數(shù)據(jù)中心算效評(píng)測(cè)發(fā)展的方向。
浪潮信息產(chǎn)品方案開發(fā)部標(biāo)準(zhǔn)認(rèn)證處經(jīng)理康真健也指出,僅從算力或能效的角度來看,目前的評(píng)估標(biāo)準(zhǔn)是割裂的,應(yīng)該更多地考慮能效和算力產(chǎn)出是否經(jīng)濟(jì)。例如,從每消耗一度電或一定的二氧化碳排放量,社會(huì)能獲得多少算力價(jià)值,來衡量高性能與低能耗之間的關(guān)系。比如SPEC組織在制定SART標(biāo)準(zhǔn)時(shí),強(qiáng)調(diào)了用戶實(shí)際獲得的算力與消耗電力的比值,這是一個(gè)需要精確計(jì)算的重要指標(biāo)。
英特爾亞太研發(fā)數(shù)據(jù)中心工程部經(jīng)理沈勇表示,不同行業(yè)應(yīng)用的算力需求各異,處理器也在面向應(yīng)用進(jìn)行不同的優(yōu)化,比如英特爾的新平臺(tái)一款是針對(duì)性能優(yōu)化的叫性能核,另一款是考慮到客戶對(duì)能效的需求,計(jì)算性能到一定程度之后更關(guān)注能效,提供面向能效優(yōu)化的叫能效核。未來隨著核心數(shù)的增長(zhǎng),如何發(fā)揮最大性能,同時(shí)平衡性能與能效會(huì)面臨很大挑戰(zhàn),對(duì)軟件、生態(tài)提出更高的要求,全產(chǎn)業(yè)鏈合作將成為關(guān)鍵。
智能時(shí)代的到來推動(dòng)了算力范式的深刻變革,不同行業(yè)對(duì)服務(wù)器算效的需求愈發(fā)多樣化和復(fù)雜化。在此次沙龍中,產(chǎn)業(yè)界對(duì)算效評(píng)估標(biāo)準(zhǔn)化高度關(guān)注,OCTC也正式公布了面向多樣化應(yīng)用場(chǎng)景的《服務(wù)器算力算效評(píng)價(jià)規(guī)范》。該規(guī)范面向大數(shù)據(jù)、人工智能等應(yīng)用場(chǎng)景,由中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)牽頭,業(yè)界芯片廠商、系統(tǒng)廠商及數(shù)據(jù)中心用戶等聯(lián)合參與編制,評(píng)測(cè)方案、評(píng)測(cè)工具和標(biāo)準(zhǔn)細(xì)則正在制定中。
OCTC熱忱歡迎更多機(jī)構(gòu)及產(chǎn)業(yè)鏈上下游從業(yè)者積極參與,以確保規(guī)范的完善性和適用性,構(gòu)建開放、公平的服務(wù)器算力評(píng)估基準(zhǔn),推動(dòng)算力產(chǎn)業(yè)的快速發(fā)展。