国产一区免费视频,中文字幕精品一区二区精品在线观看

55家企業(yè)火拼“千模大戰(zhàn)”，誰(shuí)真刀實(shí)槍?zhuān)l(shuí)虛晃一劍？

隨著ChatGPT火遍全球，“千模大戰(zhàn)”在國(guó)內(nèi)已經(jīng)打響！

今年3~5月，堪稱(chēng)“國(guó)產(chǎn)大模型之春”。據(jù)智東西統(tǒng)計(jì)，自2022年11月ChatGPT發(fā)布至5月29日，國(guó)內(nèi)至少有55個(gè)類(lèi)GPT大模型已經(jīng)推出或馬上面世，互聯(lián)網(wǎng)和云服務(wù)大廠、AI企業(yè)、行業(yè)頭部公司、高校及科研機(jī)構(gòu)、大數(shù)據(jù)及算力提供商都參與到這場(chǎng)AI“大亂斗”之中來(lái)了。

下表展示了國(guó)內(nèi)的類(lèi)GPT大模型發(fā)布/更新的具體情況。為了呈現(xiàn)更清楚，本表格僅以企業(yè)最新一次大模型重大進(jìn)展情況為參照，比如百度、阿里早在位列第一的MiniMax之前推出了大模型，但我們選擇統(tǒng)計(jì)其今年最新公布的文心一言、通義千問(wèn)的進(jìn)展節(jié)點(diǎn)；華為于2021年4月就推出了盤(pán)古大模型，但由于在統(tǒng)計(jì)時(shí)間內(nèi)未公布重大進(jìn)展，因此未列入表格。

根據(jù)近日在2023中關(guān)村(5.930, -0.03, -0.50%)論壇上面世的《中國(guó)人工智能大模型地圖研究報(bào)告》，全國(guó)有14個(gè)�。ㄊ校┰陂_(kāi)展大模型研發(fā)，其中僅是北京、廣東兩地的大模型產(chǎn)品分別達(dá)到38個(gè)和20個(gè)，可以說(shuō)全局情況遠(yuǎn)超我們?nèi)庋劭梢?jiàn)的信息面。

國(guó)產(chǎn)大模型浩浩蕩蕩，但這還沒(méi)算上陸續(xù)官宣創(chuàng)業(yè)的業(yè)界大佬動(dòng)作，今年2月起，從美團(tuán)聯(lián)合創(chuàng)始人王慧文到搜狗創(chuàng)始人王小川，再到李開(kāi)復(fù)宣布Project AI 2.0計(jì)劃……大佬“從大廠畢業(yè)去做AI”成為科技圈的新趨勢(shì)。

在5月的一場(chǎng)ICT市場(chǎng)趨勢(shì)論壇上，知名行研機(jī)構(gòu)IDC對(duì)基于大模型的AI市場(chǎng)規(guī)模進(jìn)行了預(yù)測(cè)：中國(guó)AI市場(chǎng)規(guī)模在2023年將超過(guò)147億美元，到2026年將超過(guò)263億美元。市場(chǎng)增量主要源于基于大模型的AI應(yīng)用、生成式AI及新AI企業(yè)應(yīng)用，不具備大模型能力的廠商難以維持競(jìng)爭(zhēng)優(yōu)勢(shì)。這樣的局勢(shì)給了國(guó)內(nèi)互聯(lián)網(wǎng)大廠及AI企業(yè)無(wú)限壓力。

實(shí)際上，國(guó)內(nèi)大模型于2021年前后就嶄露頭角。三年來(lái)，國(guó)內(nèi)企業(yè)推出的大模型參數(shù)規(guī)模從幾十億擴(kuò)展到幾萬(wàn)億；同時(shí)，通用大模型也在向行業(yè)大模型發(fā)展，應(yīng)用從Demo進(jìn)化為測(cè)試版本，已有一定技術(shù)和產(chǎn)業(yè)基礎(chǔ)。

但ChatGPT橫空出世，讓國(guó)內(nèi)玩家看到其間的代際差距現(xiàn)實(shí)。即便是被寄予厚望的百度文心一言，也只被其創(chuàng)始人打了70分。只有在中文大模型及特定細(xì)分行業(yè)的局部領(lǐng)域，國(guó)內(nèi)大模型或許能短期內(nèi)趕超。

隨著逆全球化風(fēng)險(xiǎn)在全球蔓延，很多人期盼國(guó)內(nèi)出現(xiàn)與ChatGPT對(duì)打的技術(shù)。那么在這場(chǎng)“千模大戰(zhàn)”之中，這些大模型有什么相似和不同之處？哪些是真刀實(shí)槍?zhuān)男┯质翘摶我粍�？它們前景如何，�?jìng)賽格局又會(huì)怎樣？本文對(duì)此進(jìn)行了深入探討。

01．

互聯(lián)網(wǎng)云大廠圍攻ChatGPT軍備賽打響

近幾個(gè)月，隨著微軟、谷歌、亞馬遜等硅谷大廠紛紛公布大模型及AIGC進(jìn)展，通過(guò)AI搜索引擎、AI辦公軟件等一系列應(yīng)用打響AI競(jìng)賽，國(guó)內(nèi)互聯(lián)網(wǎng)云大廠也陸續(xù)全軍出擊了。

以百度、阿里、騰訊、華為為第一梯隊(duì)玩家，360、京東、網(wǎng)易、知乎等為第二梯隊(duì)玩家，以及字節(jié)跳動(dòng)、快手、小紅書(shū)等為潛力玩家，互聯(lián)網(wǎng)/云大廠已經(jīng)在大模型、算力設(shè)施、AIGC應(yīng)用產(chǎn)品、生態(tài)等各方面展開(kāi)了明爭(zhēng)暗斗。

眾所周知，打響應(yīng)戰(zhàn)ChatGPT第一槍的互聯(lián)網(wǎng)大廠是百度，今年3月面世的文心一言（ERNIE Bot）是百度在2021年12月推出的百度·文心（ERNIE 3.0 Titan）迭代而來(lái)的細(xì)分模型，百度創(chuàng)始人李彥宏稱(chēng)將用其重構(gòu)百度所有的應(yīng)用。而后，首個(gè)跳出來(lái)硬剛百度的是阿里。4月11日，阿里云推出通義千問(wèn)大語(yǔ)言模型（LLM），阿里董事會(huì)主席兼CEO張勇宣布，阿里所有產(chǎn)品將接入大模型全面升級(jí)。阿里的大模型進(jìn)展公開(kāi)可追溯到2021年10月的云棲大會(huì)。

隨著百度、阿里參戰(zhàn)，互聯(lián)網(wǎng)云大廠AI競(jìng)賽開(kāi)始變得硝煙四起。

4月9日，360集團(tuán)基于360GPT大模型的“360智腦”落地搜索場(chǎng)景內(nèi)測(cè)；

同日，京東透露京東言犀大模型預(yù)訓(xùn)練參數(shù)達(dá)到千億級(jí)，2月言犀平臺(tái)曾官宣推出“產(chǎn)業(yè)版ChatGPT”：ChatJD；

4月13日，知乎和面壁科技合作推出中文大模型“知海圖AI”，落地“熱榜摘要”開(kāi)啟內(nèi)測(cè)；

近日，短視頻廠商字節(jié)跳動(dòng)、快手，以及生活方式平臺(tái)小紅書(shū)都已籌備大模型團(tuán)隊(duì)或透露出大模型計(jì)劃。

……

華為和騰訊仍未在這波大模型浪潮正式推新，但已經(jīng)從局部領(lǐng)域圍而攻之。

比如，華為于2021年4月就推出了盤(pán)古系列大模型，并在2022年推出了礦山、氣象、金融OCR等行業(yè)大模型。4月17日，華為云旗下的智能編程助手CodeArts Snap在深圳一場(chǎng)“華為代碼大模型的方案與應(yīng)用”活動(dòng)中露面。

再看看騰訊這邊，其也在2022年12月推出了萬(wàn)億參數(shù)的中文NLP預(yù)訓(xùn)練模型“混元”（HunYuan-NLP-1T），但至今未正式披露類(lèi)ChatGPT應(yīng)用的新進(jìn)展。4月14日，騰訊云推出大模型算力集群；5月15日，騰訊云副總裁、騰訊云智能平臺(tái)負(fù)責(zé)人李學(xué)朝透露：“具體的大模型騰訊內(nèi)部正在做……具體進(jìn)度后續(xù)會(huì)統(tǒng)一對(duì)外公布。”

當(dāng)然，仍有一些互聯(lián)網(wǎng)大廠表現(xiàn)得比較謹(jǐn)慎。比如搜狐董事局主席兼CEO張朝陽(yáng)近日接受媒體采訪時(shí)稱(chēng)，搜狐現(xiàn)在對(duì)大模型仍是觀望，應(yīng)該會(huì)從應(yīng)用角度來(lái)看一看，相對(duì)還是比較謹(jǐn)慎一點(diǎn)，但在整個(gè)GPT的應(yīng)用方面搜狐已經(jīng)開(kāi)始在產(chǎn)品里逐漸滲透了。

通用大模型之戰(zhàn)是大廠的大型軍備競(jìng)賽。

市面上大廠推出的大模型，大多是基于Transformer架構(gòu)進(jìn)行開(kāi)發(fā)的通用大模型，這是一場(chǎng)算法、算力和數(shù)據(jù)以及應(yīng)用落地、生態(tài)合作的全面比拼。這邊，百度剛剛宣布文心一言接入企業(yè)超700家；那邊，阿里云宣布全系產(chǎn)品史上最大規(guī)模降價(jià)，發(fā)起規(guī)模戰(zhàn)進(jìn)行攻擊；看似按兵不動(dòng)的華為則加速在行業(yè)“圈地”，搶占大模型落地先機(jī)。

合作成為BATH以外的互聯(lián)網(wǎng)企業(yè)的關(guān)鍵抉擇。比如360集團(tuán)和知名AI大模型企業(yè)智譜AI于5月宣布了戰(zhàn)略合作，共同研發(fā)千億級(jí)大模型“360GLM”，借鑒“微軟+OpenAI”組合的分工模式。5月24日，云知聲也宣布了與360集團(tuán)的戰(zhàn)略合作，雙方將積極推動(dòng)山海大模型在各領(lǐng)域的落地應(yīng)用。

在打法上，互聯(lián)網(wǎng)云大廠大多“兩條腿走路”：一邊通過(guò)提供大模型MaaS，獲取平臺(tái)服務(wù)費(fèi)用；一邊通過(guò)出租算力和推訓(xùn)平臺(tái)，賺取大模型企業(yè)的租金。兩種方式都有望成為云服務(wù)業(yè)務(wù)的新增長(zhǎng)點(diǎn)，并帶來(lái)新的云服務(wù)范式。

盡管戰(zhàn)爭(zhēng)仍在初期，大廠之間已經(jīng)開(kāi)始明著較量，陣勢(shì)不小。

02．

AI企業(yè)大亂斗：數(shù)量多爆發(fā)強(qiáng)避開(kāi)“巨獸的腳印”搶生存空間

AI大模型也吸引了一大批創(chuàng)業(yè)者，從美團(tuán)聯(lián)合創(chuàng)始人王慧文到搜狗創(chuàng)始人王小川，再到李開(kāi)復(fù)宣布Project AI 2.0計(jì)劃，眾多大佬都在加入AIGC創(chuàng)業(yè)潮。

實(shí)際上，國(guó)內(nèi)已有一批AI企業(yè)率先將大模型做出來(lái)了。

據(jù)智東西統(tǒng)計(jì)，國(guó)內(nèi)至少有19家AI企業(yè)加入了這場(chǎng)AI大模型之戰(zhàn)，其中4月官宣的企業(yè)達(dá)到9家，接近一半。如下圖所示，這些AI企業(yè)大致分為兩類(lèi)，一類(lèi)是專(zhuān)用AI中小模型起家的企業(yè)，一般成立有一段時(shí)間了；一類(lèi)是原生AI大模型創(chuàng)企，大多是新公司。

在第一類(lèi)AI企業(yè)中，最受關(guān)注的無(wú)疑是NLP領(lǐng)域龍頭企業(yè)科大訊飛(55.840, -0.79, -1.40%)，其于5月6日推出的“星火”大模型已開(kāi)啟內(nèi)測(cè)，與文心一言打擂臺(tái)。

此外還有商湯科技，其于4月10日推出“日日新SenseNova”大模型體系，包括其自研中文語(yǔ)言大模型應(yīng)用平臺(tái)“商量”等。近期，包括云從科技(26.240, -6.56, -20.00%)、云知聲、曠視科技等專(zhuān)用AI起家的知名企業(yè)都披露了大模型動(dòng)向。這類(lèi)企業(yè)具有AI算法研究的人才隊(duì)伍及經(jīng)驗(yàn)積累，長(zhǎng)處在于算法研發(fā)和行業(yè)工程化突破。

第二類(lèi)企業(yè)是AI大模型原生企業(yè)，如昆侖萬(wàn)維(50.270, -1.83, -3.51%)，其在4月10日正式推出千億級(jí)大語(yǔ)言模型“天工3.5”，對(duì)標(biāo)ChatGPT、支持萬(wàn)字以上的文本對(duì)話(huà)。有很多AI大模型企業(yè)創(chuàng)立不久，比如創(chuàng)立于2021年的瀾舟科技、MiniMax等，但其團(tuán)隊(duì)成員做大模型的時(shí)間卻跨越數(shù)年。這波大模型浪潮的到來(lái)令這些企業(yè)壓力不小，催促其加快結(jié)合細(xì)分賽道的產(chǎn)業(yè)化探索。

可以看到，在這些大模型的領(lǐng)域分布上，NLP仍是目前大模型研發(fā)最為活躍的重點(diǎn)領(lǐng)域，其次是多模態(tài)領(lǐng)域，在CV和智能語(yǔ)音等領(lǐng)域的大模型還較少。

AIGC大模型已成為熱門(mén)投資領(lǐng)域，金沙江創(chuàng)投管理合伙人朱嘯虎近日發(fā)文透露今年的投資策略，稱(chēng)今年一半投資都給了AIGC。反過(guò)來(lái)對(duì)于AI公司來(lái)說(shuō)，推出大模型有望幫公司吸引更多資金以推動(dòng)估值上漲，比如剛剛推出AI大語(yǔ)言模型“序列猴子”的出門(mén)問(wèn)問(wèn)，就被彭博社爆料正推動(dòng)港股IPO，可能籌集約2億至3億美元。

在互聯(lián)網(wǎng)大廠的團(tuán)戰(zhàn)之下，AI創(chuàng)企的空間有多大？

對(duì)此多位業(yè)內(nèi)人士和投資人告訴智東西，AI大模型領(lǐng)域不同于互聯(lián)網(wǎng)“大補(bǔ)貼”時(shí)代，可能不會(huì)贏家通吃，而是百花齊放。

一方面，大語(yǔ)言模型在產(chǎn)業(yè)可能仍是大廠主導(dǎo)，因?yàn)閰①惾雸?chǎng)券是足夠的錢(qián)、數(shù)據(jù)、算力及人才。比如OpenAI三年前接受了微軟為其打造的一臺(tái)由數(shù)萬(wàn)個(gè)A100 GPU組成、價(jià)值數(shù)億美元的大型AI超級(jí)計(jì)算機(jī)，據(jù)推測(cè)標(biāo)準(zhǔn)大小的ChatGPT-175B大概需要625臺(tái)8卡DGX A100服務(wù)器進(jìn)行訓(xùn)練，成本約達(dá)到3~5億元人民幣。創(chuàng)企融來(lái)的幾億元在這個(gè)層面幾乎做不了什么，大廠則資金相對(duì)充裕。

但另一方面，有業(yè)內(nèi)人士告訴智東西，一些關(guān)鍵點(diǎn)突破可能還要看科創(chuàng)公司。據(jù)悉，國(guó)內(nèi)AI企業(yè)的大模型很多是基于GPT-2開(kāi)源模型開(kāi)發(fā)而來(lái)，與GPT-4仍有代際差。由于GPT-4是閉源的，國(guó)內(nèi)企業(yè)無(wú)法參考論文而只能自行研發(fā)追趕，并不是投錢(qián)和時(shí)間就能攻克的。因此從算法層面來(lái)說(shuō)，AI創(chuàng)企與互聯(lián)網(wǎng)大廠可以說(shuō)站在同一起跑線，甚至聚焦創(chuàng)新的能力會(huì)更強(qiáng)。

正因?yàn)锳I大模型算法結(jié)構(gòu)突破難度大，許多創(chuàng)企公司都是由高校及科研機(jī)構(gòu)成果孵化而來(lái)。與此同時(shí)，眾多高校直接推出了大模型，包括復(fù)旦大學(xué)、清華大學(xué)、武漢大學(xué)等。

根據(jù)《中國(guó)人工智能大模型地圖研究報(bào)告》，大模型的學(xué)術(shù)影響力已初步形成，但仍有提升空間。在開(kāi)源影響力方面，國(guó)內(nèi)大模型研發(fā)團(tuán)隊(duì)在積極推進(jìn)大模型開(kāi)源發(fā)展，目前已經(jīng)有超過(guò)半數(shù)大模型實(shí)現(xiàn)開(kāi)源，且高校和科研機(jī)構(gòu)是開(kāi)源主力。

即便是基于強(qiáng)大科研成果，AI初創(chuàng)企業(yè)要突圍還需要花些巧勁。正如創(chuàng)世伙伴資本合伙人梁宇此前告訴智東西：“創(chuàng)企要學(xué)會(huì)躲開(kāi)‘巨獸踩下的腳印’，所有偉大的公司都是從很小的縫隙中鉆出來(lái)的。”

在大廠領(lǐng)跑的同時(shí)，初創(chuàng)公司的機(jī)會(huì)可能在應(yīng)用層，從垂直領(lǐng)域切入做產(chǎn)業(yè)落地、降本增效。比如瀾舟科技聚焦的就是金融領(lǐng)域。其于3月14日推出孟子對(duì)話(huà)大模型，而早在2021年7月推出了孟子（MChat）大模型及相關(guān)系列開(kāi)源模型。基于Transformer，孟子大模型可支持以及快速替換自回歸（如GPT）、自編碼（如BERT）等多種預(yù)訓(xùn)練模型。

03．

傳統(tǒng)行業(yè)公司與算力企業(yè)紛紛入局搶占絕佳站位

說(shuō)到AI大模型競(jìng)賽，數(shù)據(jù)是必不可少的一環(huán)。傳統(tǒng)行業(yè)公司掌握海量數(shù)據(jù)(19.000, 0.19, 1.01%)（維權(quán)），是這波“千模大戰(zhàn)”中另一類(lèi)不容小覷的選手。

據(jù)智東西統(tǒng)計(jì)，截至目前至少有15家傳統(tǒng)行業(yè)公司推出了行業(yè)大模型。其中，金融領(lǐng)域涉及的企業(yè)最多，包括中國(guó)農(nóng)業(yè)銀行(3.560, 0.06, 1.71%)、江蘇銀行(7.520, -0.01, -0.13%)、度小滿(mǎn)、奇富科技等；教育領(lǐng)域涉及的企業(yè)僅此其后，包括網(wǎng)易有道、學(xué)而思、淘云科技、孩子王(12.140, 0.30, 2.53%)等推出或計(jì)劃推出大模型。此外，醫(yī)療、自動(dòng)駕駛、智能物聯(lián)等領(lǐng)域的行業(yè)公司都已經(jīng)行動(dòng)。

隨著大模型產(chǎn)業(yè)化落地加速推進(jìn)，目測(cè)一大批來(lái)自各個(gè)行業(yè)的大模型也將噴涌而出。

行業(yè)頭部公司由于接近客戶(hù)和落地場(chǎng)景，因此更容易在數(shù)據(jù)、應(yīng)用落地方面占據(jù)優(yōu)勢(shì)。比如近日，度小滿(mǎn)正式開(kāi)源國(guó)內(nèi)首個(gè)千億級(jí)中文金融大模型——“軒轅”。軒轅大模型是在1760億參數(shù)的Bloom大模型基礎(chǔ)上訓(xùn)練而來(lái)，在金融名詞理解、金融市場(chǎng)評(píng)論、金融數(shù)據(jù)分析和金融新聞理解等任務(wù)上，效果相較于通用大模型大幅提升。

說(shuō)到數(shù)據(jù)，實(shí)際上也有一些大數(shù)據(jù)起家的公司推出了大模型。比如大數(shù)據(jù)公司達(dá)觀數(shù)據(jù)就于3月18日推出了曹植大模型，不過(guò)具體參數(shù)和應(yīng)用效果還不清楚。

此外，一些算力公司也推出了大模型。比如4月29日消息，聯(lián)發(fā)科在4月28日發(fā)表官方博客稱(chēng)，聯(lián)發(fā)科AI研究小組近日發(fā)布了全球第一個(gè)繁體中文大型語(yǔ)言模型BLOOM-zh。多語(yǔ)言模型BLOOM-zh在保持其英語(yǔ)功能的同時(shí)，在大多數(shù)繁體中文基準(zhǔn)上優(yōu)于其前身。

國(guó)內(nèi)服務(wù)器頭部企業(yè)浪潮甚至在2021年9月就推出了源1.0大模型。根據(jù)公司2月在深交所互動(dòng)平臺(tái)上的發(fā)言，源1.0模型結(jié)構(gòu)與GPT-3類(lèi)似，與GPT-3相比參數(shù)量增加40%，訓(xùn)練數(shù)據(jù)集提升10倍，達(dá)到了2457億參數(shù)，訓(xùn)練使用了5TB的高質(zhì)量中文數(shù)據(jù)。消息稱(chēng)，源2.0也將在不久之后發(fā)布。

國(guó)家超算天津中心于5月19日推出了“天河E級(jí)智能計(jì)算開(kāi)放創(chuàng)新平臺(tái)”和“天河天元大模型”，據(jù)稱(chēng)將帶來(lái)突破百億次的跨模態(tài)的超級(jí)計(jì)算算力，支撐傳統(tǒng)的科學(xué)工程計(jì)算，并服務(wù)智能混合計(jì)算，成為智算中心機(jī)構(gòu)布局大模型的代表。

可以看到，行業(yè)、大數(shù)據(jù)、算力領(lǐng)域的大模型入局玩家還不多。但由于這些領(lǐng)域的企業(yè)往往擁有算力和算力優(yōu)勢(shì)，如果與AI大模型企業(yè)合作，有望在大模型領(lǐng)域?qū)崿F(xiàn)超車(chē)，這都為“千模大戰(zhàn)”的戰(zhàn)況帶來(lái)更多變數(shù)。

04．

結(jié)語(yǔ)：千模大戰(zhàn)打響研發(fā)和落地是持久戰(zhàn)

僅僅兩個(gè)月時(shí)間，國(guó)內(nèi)的大模型之戰(zhàn)已經(jīng)打響，互聯(lián)網(wǎng)/云服務(wù)大廠、AI企業(yè)、傳統(tǒng)行業(yè)公司、大數(shù)據(jù)公司以及算法公司全都入局了。

可以看到，入局的公司要么在資本實(shí)力、平臺(tái)生態(tài)、應(yīng)用場(chǎng)景方面占據(jù)優(yōu)勢(shì)，要么在算法、算力和數(shù)據(jù)層面構(gòu)筑了護(hù)城河，但這都只是一張“入場(chǎng)券”。

AI大模型創(chuàng)業(yè)將是一場(chǎng)持久戰(zhàn)。國(guó)內(nèi)的大模型產(chǎn)品大多與GPT-4仍有代際差，這畢竟是一個(gè)高難度的系統(tǒng)性工程，仍需要國(guó)內(nèi)大模型玩家深耕技術(shù)、貼合應(yīng)用，以此在硅谷巨頭的包圍中實(shí)現(xiàn)突破。

“千模大戰(zhàn)”100天：六路玩家圍攻ChatGPT