5月29日,中國(guó)移動(dòng)聯(lián)合清華大學(xué)完成業(yè)界首次憶阻器存算一體芯片的端到端技術(shù)驗(yàn)證,成功打通芯片、軟件、算法、應(yīng)用全流程,標(biāo)志著基于新型存儲(chǔ)器的存算一體技術(shù)向產(chǎn)業(yè)化邁出了關(guān)鍵一步,為拓展存算一體芯片在端邊側(cè)應(yīng)用、構(gòu)建存算一體產(chǎn)業(yè)生態(tài)奠定了重要基礎(chǔ)。
存算一體作為先進(jìn)計(jì)算技術(shù),從架構(gòu)上突破馮·諾依曼架構(gòu)存儲(chǔ)和計(jì)算分離導(dǎo)致的存儲(chǔ)墻和功耗墻問題,可大幅提升算力和能效水平,在AI時(shí)代的重要性日益凸顯。
中國(guó)移動(dòng)自2021年起開展存算一體技術(shù)研究,并與高校和產(chǎn)業(yè)伙伴聯(lián)合推動(dòng)存算一體多技術(shù)路線探索和研發(fā)。2022年提出“如何實(shí)現(xiàn)存算一體芯片工程化和產(chǎn)業(yè)化”提案,并獲評(píng)為中國(guó)科協(xié)“10個(gè)對(duì)產(chǎn)業(yè)發(fā)展具有引領(lǐng)作用的產(chǎn)業(yè)技術(shù)問題”之一;同年,聯(lián)合清華大學(xué)研發(fā)業(yè)界首款基于憶阻器的110nm制程存算一體SoC芯片,單芯片憶阻器集成規(guī)模突破300萬,算力能效較相同工藝下的主流GPU提升2個(gè)數(shù)量級(jí),達(dá)業(yè)內(nèi)領(lǐng)先水平。但從產(chǎn)業(yè)維度來看存算一體目前仍處于初級(jí)發(fā)展階段,主要廠商多聚焦在芯片研發(fā)層面,而在產(chǎn)業(yè)鏈其他環(huán)節(jié)難以集中力量開展布局,導(dǎo)致缺乏成熟的軟件工具鏈和模型適配算法,缺少典型性的應(yīng)用引領(lǐng)及相關(guān)的測(cè)試驗(yàn)證標(biāo)準(zhǔn)平臺(tái),產(chǎn)業(yè)生態(tài)構(gòu)建存在諸多困難。
面對(duì)存算一體產(chǎn)業(yè)發(fā)展的挑戰(zhàn),中國(guó)移動(dòng)聯(lián)合清華大學(xué)等高校和智存科技等頭部企業(yè),圍繞軟件、算法、應(yīng)用環(huán)節(jié)的短板精準(zhǔn)發(fā)力:在軟件方面,研發(fā)了適配存算一體芯片的半自動(dòng)化軟件計(jì)算引擎,支持面向存算一體計(jì)算架構(gòu)的AI模型編譯、算子編排、模型部署和推理以及芯片性能模擬等功能,有效降低用戶開發(fā)和部署門檻,開發(fā)調(diào)試效率提升3倍以上。在算法方面,針對(duì)存算一體器件規(guī)模受限和模擬計(jì)算誤差的問題,提出面向存算一體的模型壓縮、誤差補(bǔ)償和加噪訓(xùn)練等適配算法,在保證計(jì)算準(zhǔn)確性的同時(shí)將模型規(guī)模縮減至1/16,實(shí)現(xiàn)AI模型在存算一體芯片的高效、準(zhǔn)確和魯棒運(yùn)行。在應(yīng)用驗(yàn)證方面,實(shí)現(xiàn)存算一體芯片與自研的5G工業(yè)網(wǎng)關(guān)的硬件系統(tǒng)集成,并通過自研的軟件計(jì)算引擎輔助實(shí)現(xiàn)了多種人工智能模型的自動(dòng)部署和推理,在衛(wèi)星圖像分類、PCB板質(zhì)檢等場(chǎng)景完成應(yīng)用驗(yàn)證:其中衛(wèi)星圖像識(shí)別準(zhǔn)確率達(dá)96%以上,PCB板質(zhì)檢實(shí)現(xiàn)5種常見元件的精準(zhǔn)識(shí)別和定位,并支持3種以上微小瑕疵的自動(dòng)檢測(cè)。
本次端對(duì)端技術(shù)驗(yàn)證是存算一體由技術(shù)研究邁向產(chǎn)業(yè)應(yīng)用的關(guān)鍵環(huán)節(jié),中國(guó)移動(dòng)作為移動(dòng)信息產(chǎn)業(yè)鏈鏈長(zhǎng),將持續(xù)發(fā)揮產(chǎn)業(yè)引領(lǐng)作用,推進(jìn)產(chǎn)學(xué)研用合作,積極構(gòu)建自主可控的存算一體新型算力生態(tài)。
圖1 憶阻器存算一體芯片A111及存算一體計(jì)算板卡
圖2 基于存算一體芯片的5G工業(yè)網(wǎng)關(guān)
圖3 基于存算一體芯片的邊緣智能示范演示平臺(tái)