首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 應用 >> 正文

“千模大戰(zhàn)”100天:六路玩家圍攻ChatGPT

2023年5月30日 07:53  智東西  作 者:李水青

55家企業(yè)火拼“千模大戰(zhàn)”,誰真刀實槍,誰虛晃一劍?

隨著ChatGPT火遍全球,“千模大戰(zhàn)”在國內已經(jīng)打響!

今年3~5月,堪稱“國產(chǎn)大模型之春”。據(jù)智東西統(tǒng)計,自2022年11月ChatGPT發(fā)布至5月29日,國內至少有55個類GPT大模型已經(jīng)推出或馬上面世,互聯(lián)網(wǎng)和云服務大廠、AI企業(yè)、行業(yè)頭部公司、高校及科研機構、大數(shù)據(jù)及算力提供商都參與到這場AI“大亂斗”之中來了。

下表展示了國內的類GPT大模型發(fā)布/更新的具體情況。為了呈現(xiàn)更清楚,本表格僅以企業(yè)最新一次大模型重大進展情況為參照,比如百度、阿里早在位列第一的MiniMax之前推出了大模型,但我們選擇統(tǒng)計其今年最新公布的文心一言、通義千問的進展節(jié)點;華為于2021年4月就推出了盤古大模型,但由于在統(tǒng)計時間內未公布重大進展,因此未列入表格。

根據(jù)近日在2023中關村(5.930, -0.03, -0.50%)論壇上面世的《中國人工智能大模型地圖研究報告》,全國有14個。ㄊ校┰陂_展大模型研發(fā),其中僅是北京、廣東兩地的大模型產(chǎn)品分別達到38個和20個,可以說全局情況遠超我們肉眼可見的信息面。

國產(chǎn)大模型浩浩蕩蕩,但這還沒算上陸續(xù)官宣創(chuàng)業(yè)的業(yè)界大佬動作,今年2月起,從美團聯(lián)合創(chuàng)始人王慧文到搜狗創(chuàng)始人王小川,再到李開復宣布Project AI 2.0計劃……大佬“從大廠畢業(yè)去做AI”成為科技圈的新趨勢。

在5月的一場ICT市場趨勢論壇上,知名行研機構IDC對基于大模型的AI市場規(guī)模進行了預測:中國AI市場規(guī)模在2023年將超過147億美元,到2026年將超過263億美元。市場增量主要源于基于大模型的AI應用、生成式AI及新AI企業(yè)應用,不具備大模型能力的廠商難以維持競爭優(yōu)勢。這樣的局勢給了國內互聯(lián)網(wǎng)大廠及AI企業(yè)無限壓力。

實際上,國內大模型于2021年前后就嶄露頭角。三年來,國內企業(yè)推出的大模型參數(shù)規(guī)模從幾十億擴展到幾萬億;同時,通用大模型也在向行業(yè)大模型發(fā)展,應用從Demo進化為測試版本,已有一定技術和產(chǎn)業(yè)基礎。

但ChatGPT橫空出世,讓國內玩家看到其間的代際差距現(xiàn)實。即便是被寄予厚望的百度文心一言,也只被其創(chuàng)始人打了70分。只有在中文大模型及特定細分行業(yè)的局部領域,國內大模型或許能短期內趕超。

隨著逆全球化風險在全球蔓延,很多人期盼國內出現(xiàn)與ChatGPT對打的技術。那么在這場“千模大戰(zhàn)”之中,這些大模型有什么相似和不同之處?哪些是真刀實槍,哪些又是虛晃一劍?它們前景如何,競賽格局又會怎樣?本文對此進行了深入探討。

01.

互聯(lián)網(wǎng)云大廠圍攻ChatGPT軍備賽打響

近幾個月,隨著微軟、谷歌、亞馬遜等硅谷大廠紛紛公布大模型及AIGC進展,通過AI搜索引擎、AI辦公軟件等一系列應用打響AI競賽,國內互聯(lián)網(wǎng)云大廠也陸續(xù)全軍出擊了。

以百度、阿里、騰訊、華為為第一梯隊玩家,360、京東、網(wǎng)易、知乎等為第二梯隊玩家,以及字節(jié)跳動、快手、小紅書等為潛力玩家,互聯(lián)網(wǎng)/云大廠已經(jīng)在大模型、算力設施、AIGC應用產(chǎn)品、生態(tài)等各方面展開了明爭暗斗。

眾所周知,打響應戰(zhàn)ChatGPT第一槍的互聯(lián)網(wǎng)大廠是百度,今年3月面世的文心一言(ERNIE Bot)是百度在2021年12月推出的百度·文心(ERNIE 3.0 Titan)迭代而來的細分模型,百度創(chuàng)始人李彥宏稱將用其重構百度所有的應用。而后,首個跳出來硬剛百度的是阿里。4月11日,阿里云推出通義千問大語言模型(LLM),阿里董事會主席兼CEO張勇宣布,阿里所有產(chǎn)品將接入大模型全面升級。阿里的大模型進展公開可追溯到2021年10月的云棲大會。

隨著百度、阿里參戰(zhàn),互聯(lián)網(wǎng)云大廠AI競賽開始變得硝煙四起。

4月9日,360集團基于360GPT大模型的“360智腦”落地搜索場景內測;

同日,京東透露京東言犀大模型預訓練參數(shù)達到千億級,2月言犀平臺曾官宣推出“產(chǎn)業(yè)版ChatGPT”:ChatJD;

4月13日,知乎和面壁科技合作推出中文大模型“知海圖AI”,落地“熱榜摘要”開啟內測;

近日,短視頻廠商字節(jié)跳動、快手,以及生活方式平臺小紅書都已籌備大模型團隊或透露出大模型計劃。

……

華為和騰訊仍未在這波大模型浪潮正式推新,但已經(jīng)從局部領域圍而攻之。

比如,華為于2021年4月就推出了盤古系列大模型,并在2022年推出了礦山、氣象、金融OCR等行業(yè)大模型。4月17日,華為云旗下的智能編程助手CodeArts Snap在深圳一場“華為代碼大模型的方案與應用”活動中露面。

再看看騰訊這邊,其也在2022年12月推出了萬億參數(shù)的中文NLP預訓練模型“混元”(HunYuan-NLP-1T),但至今未正式披露類ChatGPT應用的新進展。4月14日,騰訊云推出大模型算力集群;5月15日,騰訊云副總裁、騰訊云智能平臺負責人李學朝透露:“具體的大模型騰訊內部正在做……具體進度后續(xù)會統(tǒng)一對外公布!

當然,仍有一些互聯(lián)網(wǎng)大廠表現(xiàn)得比較謹慎。比如搜狐董事局主席兼CEO張朝陽近日接受媒體采訪時稱,搜狐現(xiàn)在對大模型仍是觀望,應該會從應用角度來看一看,相對還是比較謹慎一點,但在整個GPT的應用方面搜狐已經(jīng)開始在產(chǎn)品里逐漸滲透了。

通用大模型之戰(zhàn)是大廠的大型軍備競賽。

市面上大廠推出的大模型,大多是基于Transformer架構進行開發(fā)的通用大模型,這是一場算法、算力和數(shù)據(jù)以及應用落地、生態(tài)合作的全面比拼。這邊,百度剛剛宣布文心一言接入企業(yè)超700家;那邊,阿里云宣布全系產(chǎn)品史上最大規(guī)模降價,發(fā)起規(guī)模戰(zhàn)進行攻擊;看似按兵不動的華為則加速在行業(yè)“圈地”,搶占大模型落地先機。

合作成為BATH以外的互聯(lián)網(wǎng)企業(yè)的關鍵抉擇。比如360集團和知名AI大模型企業(yè)智譜AI于5月宣布了戰(zhàn)略合作,共同研發(fā)千億級大模型“360GLM”,借鑒“微軟+OpenAI”組合的分工模式。5月24日,云知聲也宣布了與360集團的戰(zhàn)略合作,雙方將積極推動山海大模型在各領域的落地應用。

在打法上,互聯(lián)網(wǎng)云大廠大多“兩條腿走路”:一邊通過提供大模型MaaS,獲取平臺服務費用;一邊通過出租算力和推訓平臺,賺取大模型企業(yè)的租金。兩種方式都有望成為云服務業(yè)務的新增長點,并帶來新的云服務范式。

盡管戰(zhàn)爭仍在初期,大廠之間已經(jīng)開始明著較量,陣勢不小。

02.

AI企業(yè)大亂斗:數(shù)量多爆發(fā)強避開“巨獸的腳印”搶生存空間

AI大模型也吸引了一大批創(chuàng)業(yè)者,從美團聯(lián)合創(chuàng)始人王慧文到搜狗創(chuàng)始人王小川,再到李開復宣布Project AI 2.0計劃,眾多大佬都在加入AIGC創(chuàng)業(yè)潮。

實際上,國內已有一批AI企業(yè)率先將大模型做出來了。

據(jù)智東西統(tǒng)計,國內至少有19家AI企業(yè)加入了這場AI大模型之戰(zhàn),其中4月官宣的企業(yè)達到9家,接近一半。如下圖所示,這些AI企業(yè)大致分為兩類,一類是專用AI中小模型起家的企業(yè),一般成立有一段時間了;一類是原生AI大模型創(chuàng)企,大多是新公司。

在第一類AI企業(yè)中,最受關注的無疑是NLP領域龍頭企業(yè)科大訊飛(55.840, -0.79, -1.40%),其于5月6日推出的“星火”大模型已開啟內測,與文心一言打擂臺。

此外還有商湯科技,其于4月10日推出“日日新SenseNova”大模型體系,包括其自研中文語言大模型應用平臺“商量”等。近期,包括云從科技(26.240, -6.56, -20.00%)、云知聲、曠視科技等專用AI起家的知名企業(yè)都披露了大模型動向。這類企業(yè)具有AI算法研究的人才隊伍及經(jīng)驗積累,長處在于算法研發(fā)和行業(yè)工程化突破。

第二類企業(yè)是AI大模型原生企業(yè),如昆侖萬維(50.270, -1.83, -3.51%),其在4月10日正式推出千億級大語言模型“天工3.5”,對標ChatGPT、支持萬字以上的文本對話。有很多AI大模型企業(yè)創(chuàng)立不久,比如創(chuàng)立于2021年的瀾舟科技、MiniMax等,但其團隊成員做大模型的時間卻跨越數(shù)年。這波大模型浪潮的到來令這些企業(yè)壓力不小,催促其加快結合細分賽道的產(chǎn)業(yè)化探索。

可以看到,在這些大模型的領域分布上,NLP仍是目前大模型研發(fā)最為活躍的重點領域,其次是多模態(tài)領域,在CV和智能語音等領域的大模型還較少。

AIGC大模型已成為熱門投資領域,金沙江創(chuàng)投管理合伙人朱嘯虎近日發(fā)文透露今年的投資策略,稱今年一半投資都給了AIGC。反過來對于AI公司來說,推出大模型有望幫公司吸引更多資金以推動估值上漲,比如剛剛推出AI大語言模型“序列猴子”的出門問問,就被彭博社爆料正推動港股IPO,可能籌集約2億至3億美元。

在互聯(lián)網(wǎng)大廠的團戰(zhàn)之下,AI創(chuàng)企的空間有多大?

對此多位業(yè)內人士和投資人告訴智東西,AI大模型領域不同于互聯(lián)網(wǎng)“大補貼”時代,可能不會贏家通吃,而是百花齊放。

一方面,大語言模型在產(chǎn)業(yè)可能仍是大廠主導,因為參賽入場券是足夠的錢、數(shù)據(jù)、算力及人才。比如OpenAI三年前接受了微軟為其打造的一臺由數(shù)萬個A100 GPU組成、價值數(shù)億美元的大型AI超級計算機,據(jù)推測標準大小的ChatGPT-175B大概需要625臺8卡DGX A100服務器進行訓練,成本約達到3~5億元人民幣。創(chuàng)企融來的幾億元在這個層面幾乎做不了什么,大廠則資金相對充裕。

但另一方面,有業(yè)內人士告訴智東西,一些關鍵點突破可能還要看科創(chuàng)公司。據(jù)悉,國內AI企業(yè)的大模型很多是基于GPT-2開源模型開發(fā)而來,與GPT-4仍有代際差。由于GPT-4是閉源的,國內企業(yè)無法參考論文而只能自行研發(fā)追趕,并不是投錢和時間就能攻克的。因此從算法層面來說,AI創(chuàng)企與互聯(lián)網(wǎng)大廠可以說站在同一起跑線,甚至聚焦創(chuàng)新的能力會更強。

正因為AI大模型算法結構突破難度大,許多創(chuàng)企公司都是由高校及科研機構成果孵化而來。與此同時,眾多高校直接推出了大模型,包括復旦大學、清華大學、武漢大學等。

根據(jù)《中國人工智能大模型地圖研究報告》,大模型的學術影響力已初步形成,但仍有提升空間。在開源影響力方面,國內大模型研發(fā)團隊在積極推進大模型開源發(fā)展,目前已經(jīng)有超過半數(shù)大模型實現(xiàn)開源,且高校和科研機構是開源主力。 

即便是基于強大科研成果,AI初創(chuàng)企業(yè)要突圍還需要花些巧勁。正如創(chuàng)世伙伴資本合伙人梁宇此前告訴智東西:“創(chuàng)企要學會躲開‘巨獸踩下的腳印’,所有偉大的公司都是從很小的縫隙中鉆出來的!

在大廠領跑的同時,初創(chuàng)公司的機會可能在應用層,從垂直領域切入做產(chǎn)業(yè)落地、降本增效。比如瀾舟科技聚焦的就是金融領域。其于3月14日推出孟子對話大模型,而早在2021年7月推出了孟子(MChat)大模型及相關系列開源模型;赥ransformer,孟子大模型可支持以及快速替換自回歸(如GPT)、自編碼(如BERT)等多種預訓練模型。

03.

傳統(tǒng)行業(yè)公司與算力企業(yè)紛紛入局搶占絕佳站位

說到AI大模型競賽,數(shù)據(jù)是必不可少的一環(huán)。傳統(tǒng)行業(yè)公司掌握海量數(shù)據(jù)(19.000, 0.19, 1.01%)(維權),是這波“千模大戰(zhàn)”中另一類不容小覷的選手。

據(jù)智東西統(tǒng)計,截至目前至少有15家傳統(tǒng)行業(yè)公司推出了行業(yè)大模型。其中,金融領域涉及的企業(yè)最多,包括中國農業(yè)銀行(3.560, 0.06, 1.71%)、江蘇銀行(7.520, -0.01, -0.13%)、度小滿、奇富科技等;教育領域涉及的企業(yè)僅此其后,包括網(wǎng)易有道、學而思、淘云科技、孩子王(12.140, 0.30, 2.53%)等推出或計劃推出大模型。此外,醫(yī)療、自動駕駛、智能物聯(lián)等領域的行業(yè)公司都已經(jīng)行動。

隨著大模型產(chǎn)業(yè)化落地加速推進,目測一大批來自各個行業(yè)的大模型也將噴涌而出。

行業(yè)頭部公司由于接近客戶和落地場景,因此更容易在數(shù)據(jù)、應用落地方面占據(jù)優(yōu)勢。比如近日,度小滿正式開源國內首個千億級中文金融大模型——“軒轅”。軒轅大模型是在1760億參數(shù)的Bloom大模型基礎上訓練而來,在金融名詞理解、金融市場評論、金融數(shù)據(jù)分析和金融新聞理解等任務上,效果相較于通用大模型大幅提升。

說到數(shù)據(jù),實際上也有一些大數(shù)據(jù)起家的公司推出了大模型。比如大數(shù)據(jù)公司達觀數(shù)據(jù)就于3月18日推出了曹植大模型,不過具體參數(shù)和應用效果還不清楚。

此外,一些算力公司也推出了大模型。比如4月29日消息,聯(lián)發(fā)科在4月28日發(fā)表官方博客稱,聯(lián)發(fā)科AI研究小組近日發(fā)布了全球第一個繁體中文大型語言模型BLOOM-zh。多語言模型BLOOM-zh在保持其英語功能的同時,在大多數(shù)繁體中文基準上優(yōu)于其前身。

國內服務器頭部企業(yè)浪潮甚至在2021年9月就推出了源1.0大模型。根據(jù)公司2月在深交所互動平臺上的發(fā)言,源1.0模型結構與GPT-3類似,與GPT-3相比參數(shù)量增加40%,訓練數(shù)據(jù)集提升10倍,達到了2457億參數(shù),訓練使用了5TB的高質量中文數(shù)據(jù)。消息稱,源2.0也將在不久之后發(fā)布。

國家超算天津中心于5月19日推出了“天河E級智能計算開放創(chuàng)新平臺”和“天河天元大模型”,據(jù)稱將帶來突破百億次的跨模態(tài)的超級計算算力,支撐傳統(tǒng)的科學工程計算,并服務智能混合計算,成為智算中心機構布局大模型的代表。

可以看到,行業(yè)、大數(shù)據(jù)、算力領域的大模型入局玩家還不多。但由于這些領域的企業(yè)往往擁有算力和算力優(yōu)勢,如果與AI大模型企業(yè)合作,有望在大模型領域實現(xiàn)超車,這都為“千模大戰(zhàn)”的戰(zhàn)況帶來更多變數(shù)。

04.

結語:千模大戰(zhàn)打響研發(fā)和落地是持久戰(zhàn)

僅僅兩個月時間,國內的大模型之戰(zhàn)已經(jīng)打響,互聯(lián)網(wǎng)/云服務大廠、AI企業(yè)、傳統(tǒng)行業(yè)公司、大數(shù)據(jù)公司以及算法公司全都入局了。

可以看到,入局的公司要么在資本實力、平臺生態(tài)、應用場景方面占據(jù)優(yōu)勢,要么在算法、算力和數(shù)據(jù)層面構筑了護城河,但這都只是一張“入場券”。

AI大模型創(chuàng)業(yè)將是一場持久戰(zhàn)。國內的大模型產(chǎn)品大多與GPT-4仍有代際差,這畢竟是一個高難度的系統(tǒng)性工程,仍需要國內大模型玩家深耕技術、貼合應用,以此在硅谷巨頭的包圍中實現(xiàn)突破。

編 輯:路金娣
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構成任何投資及應用建議。如網(wǎng)站內容涉及作品版權和其它問題,請在30日內與本網(wǎng)聯(lián)系,我們將在第一時間刪除內容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
工信部張云明:大部分國家新劃分了中頻段6G頻譜資源
精彩專題
專題丨“汛”速出動 共筑信息保障堤壩
2023MWC上海世界移動通信大會
中國5G商用四周年
2023年中國國際信息通信展覽會
CCTIME推薦
關于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業(yè)務經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉載、摘編、復制、鏡像