飛象網(wǎng)訊 (計育青/文)如今人工智能技術(shù)已經(jīng)在各行各業(yè)投入了廣泛應(yīng)用,從居民小區(qū)門禁系統(tǒng)的人臉識別到工廠流水線上的產(chǎn)品自動檢測,從兒童玩具中的語音對答到在線商城的客服機器人,人工智能已經(jīng)在人們工作和生活的方方面面發(fā)揮了重要作用。在經(jīng)歷了前期各個領(lǐng)域的分散性探索之后,人工智能技術(shù)開始向著通用大模型時代發(fā)展。
在近日舉行的2022年華為全聯(lián)接大會上,中國科學(xué)技術(shù)信息研究所黨委書記、所長、科技部新一代人工智能發(fā)展研究中心主任趙志耘表示,大模型具備更強的泛化能力,可以覆蓋更為多樣化的業(yè)務(wù)場景,因此產(chǎn)學(xué)研各界一致認為大模型已經(jīng)成為當(dāng)前人工智能技術(shù)發(fā)展的重要方向。在此次大會上,趙志耘宣布中國科學(xué)技術(shù)信息研究所正在與業(yè)界合作規(guī)劃大模型地圖,不久之后就會發(fā)布《中國人工智能大模型地圖研究報告》,統(tǒng)籌中國大模型有序發(fā)展,共同推進相關(guān)應(yīng)用開發(fā)和方案落地。
從追趕到領(lǐng)先
在過去十年間,人工智能技術(shù)和應(yīng)用都發(fā)展迅猛,不但傳統(tǒng)深度學(xué)習(xí)模型持續(xù)快速演進,以Transformer為代表的新型網(wǎng)絡(luò)模型、訓(xùn)練微調(diào)機制的應(yīng)用也經(jīng)歷了飛速增長。短短5年里,原本不到億級的參數(shù)規(guī)模就增長到如今萬億級別規(guī)模。
趙志耘表示,各國圍繞著人工智能大模型的研發(fā)做了很多工作,總的來說,該領(lǐng)域的主導(dǎo)權(quán)掌握在中美兩國手中。美國對大模型的研究啟動比較早,并且一直維持著較大的投入,不過中國近幾年也加快了追趕的步伐。在科研機構(gòu)與企業(yè)界的聯(lián)手推動下,從硬件到軟件,從底層技術(shù)到上層應(yīng)用,國內(nèi)取得了豐碩的成果。在此期間,人工智能計算中心也在全國各地紛紛落地,為大模型的孵化提供了強有力的算力支撐。
2020年到2021年,中國大模型數(shù)量從2個驟增至21個,基本與美國處于同等量級,大幅領(lǐng)先于世界其他各國。在此期間,國內(nèi)還出現(xiàn)了基于昇騰的鵬程、盤古、紫東、太初、悟道等千億甚至萬億級別的大模型,引起了業(yè)界的廣泛關(guān)注。
進步與挑戰(zhàn)
為全方位了解國內(nèi)大模型發(fā)展的現(xiàn)狀,中國科學(xué)技術(shù)信息研究所聯(lián)合產(chǎn)業(yè)力量,共同對中國人工智能大模型的發(fā)展現(xiàn)狀進行了調(diào)研,從分布、要素、活躍度和應(yīng)用等方面,揭示了中國人工智能大模型取得的進步、面臨的挑戰(zhàn),為下一步統(tǒng)籌規(guī)劃大模型的發(fā)展和應(yīng)用提供了一套有效的方法工具。
從分布、要素、活躍度和應(yīng)用四個維度出發(fā),中國科學(xué)技術(shù)信息研究所繪制了多個大模型分布地圖。從地域上看,全國很多地方都在開發(fā)大模型,不過主要集中在北京、深圳、西安、武漢等國家新一代人工智能發(fā)展試驗區(qū);從專注領(lǐng)域來看,現(xiàn)有的大模型主要集中在NLP和多模態(tài)方面,其它領(lǐng)域相對較少。從要素地圖來看,最關(guān)鍵的是算力和人才,大算力和頂尖人才也是大模型發(fā)展不可或缺的要素。從活躍度地圖來看,無論在學(xué)術(shù)方面還是在開源技術(shù)方面,中國依然缺少具有全球影響力的大模型,未來需要強強聯(lián)合,共同打造精英級大模型。從應(yīng)用地圖來看,國內(nèi)大模型已經(jīng)開始進行落地試驗、試點,但總量上還比較少。
趙志耘表示,總的來看,國內(nèi)大模型發(fā)展的要素缺乏統(tǒng)籌,資源浪費和資源不足同時存在,同時大模型的開發(fā)缺乏協(xié)作,發(fā)展比較分散,暫未出現(xiàn)現(xiàn)象級別標桿大模型。從落地商用的角度來看,大模型的產(chǎn)業(yè)落地仍有很多困難,未能對實體經(jīng)濟產(chǎn)生足夠的促進作用。
三個建議
據(jù)趙志耘介紹,完整版的“中國人工智能大模型地圖研究報告”將在不久后正式對外公布,報告中綜合分析了中國人工智能大模型地圖,并對中國人工智能大模型的未來發(fā)展提出了三個建議。首先是大模型發(fā)展布局應(yīng)該有統(tǒng)籌規(guī)劃,匯聚大模型發(fā)展的相關(guān)要素,同時加強發(fā)展人工智能計算中心和算力網(wǎng)絡(luò),完善人工智能大模型人才培養(yǎng)體系,圍繞國內(nèi)自主創(chuàng)新的人工智能根技術(shù)來發(fā)展我國大模型。其次,大力推進場景化創(chuàng)新,提升大模型的活躍度和影響力。第三,政府需要加大支持力度,鼓勵產(chǎn)學(xué)研各界攜手有條件的領(lǐng)域加速大模型的產(chǎn)業(yè)落地。
華為計算產(chǎn)品線總裁鄧泰華在會議期間表示,多年來華為通過昇騰構(gòu)建了一站式的大模型開發(fā)平臺,讓大模型更易開發(fā)、易適配、易部署。為促進大模型產(chǎn)業(yè)化落地,華為和伙伴結(jié)成產(chǎn)業(yè)聯(lián)合體,共同打通科研創(chuàng)新和產(chǎn)業(yè)落地,讓大模型更好地服務(wù)于各行各業(yè)。在科技部牽頭組織下,華為還與中國科學(xué)技術(shù)信息研究所等產(chǎn)業(yè)合作伙伴聯(lián)手制定大模型的沙盤,從而有序引導(dǎo)大模型的創(chuàng)新方向。“通過產(chǎn)學(xué)研聯(lián)手,我們構(gòu)建起了大模型規(guī)劃、開發(fā)部署、產(chǎn)業(yè)化落地的全流程使能體系,為中國人工智能技術(shù)和應(yīng)用發(fā)展探索出了一條行之有效的前進之路!编囂┤A說。