7月4日,2024世界人工智能大會(huì)暨人工智能全球治理高級(jí)別會(huì)議(簡(jiǎn)稱“WAIC 2024”)在上海世博中心開幕,WAIC 2024作為全球最高規(guī)格的AI產(chǎn)業(yè)盛會(huì),今年共有500多家企業(yè)參展,匯聚了超1500件展品,大模型成為本屆大會(huì)的“重頭戲”,國(guó)內(nèi)主流大模型齊聚上海灘,既包括科大訊飛星火、百度文心一言、阿里通義、騰訊元寶、華為盤古等市場(chǎng)熱門產(chǎn)品,又囊括百川智能、智譜AI、Minimax、階躍星辰等新銳實(shí)力。
從今年WAIC 2024展會(huì)可以看出,大模型產(chǎn)業(yè)逐步由虛向?qū)、錨定場(chǎng)景、深耕行業(yè),不斷發(fā)揮賦能價(jià)值。本次是訊飛星火V4.0、訊飛曉醫(yī)、星火企業(yè)智能體平臺(tái)正式發(fā)布后的首秀,不但展示了訊飛星火V4.0在學(xué)習(xí)、生活、工作等多場(chǎng)景下的最新應(yīng)用成果,還面向行業(yè)場(chǎng)景與企業(yè)客戶提供了豐富的解決方案。
國(guó)產(chǎn)算力自主可控 星火V4.0拿下“中國(guó)唯一”
去年,AIGC(生成式大模型)開啟了人工智能嶄新的時(shí)代,“生成”實(shí)際上是前端呈現(xiàn)給用戶的結(jié)果,其后端還需要經(jīng)過復(fù)雜的訓(xùn)練和運(yùn)算。因此在大模型的底層,算力扮演著重要角色。大模型數(shù)據(jù)訓(xùn)練的時(shí)長(zhǎng)或者創(chuàng)新的快慢,根本上取決于算力的大小以及穩(wěn)定、持續(xù)地供應(yīng)。但隨著中美科技博弈的加劇,如何保障大模型算力的持續(xù)供給,防止技術(shù)封鎖與“卡脖子”的發(fā)生?
正如科大訊飛董事長(zhǎng)劉慶峰所言,國(guó)產(chǎn)底座能力決定了企業(yè)在這條路上到底能走多遠(yuǎn),要以長(zhǎng)期主義來打造我們真正自主可控的AI產(chǎn)業(yè)生態(tài)。據(jù)訊飛星火V4.0發(fā)布會(huì)介紹,訊飛星火是中國(guó)第一個(gè)基于國(guó)產(chǎn)算力訓(xùn)練出來的全民開放的大模型。在國(guó)產(chǎn)化的底座下,能為行業(yè)帶來更高的話語(yǔ)權(quán)與安全性。
無論是從技術(shù)迭代還是數(shù)據(jù)安全等維度,建立自主可控的國(guó)產(chǎn)算力底座無疑才是“最優(yōu)解”,科大訊飛肩負(fù)“AI國(guó)家隊(duì)”的責(zé)任與使命,致力打造自主可控的AI產(chǎn)業(yè)生態(tài)。這次星火大模型V4.0最醒目的優(yōu)勢(shì),就是基于全國(guó)首個(gè)國(guó)產(chǎn)萬卡算力集群“飛星一號(hào)”訓(xùn)練,不僅算力與算法自主可控,而且代碼完全自己編寫,數(shù)據(jù)完全自己清洗,成為中國(guó)唯一全自主可控的大模型。
對(duì)標(biāo)GPT-4 Turbo ,國(guó)產(chǎn)大模型打造“更懂你的AI助手”
作為人工智能國(guó)家隊(duì),科大訊飛一直積極投身于通用人工智能技術(shù)浪潮,自去年五月正式發(fā)布訊飛星火大模型,持續(xù)對(duì)標(biāo)國(guó)際最先進(jìn)水平,以自主創(chuàng)新推動(dòng)每一次技術(shù)躍遷。
訊飛星火V3.0已實(shí)現(xiàn)了對(duì)ChatGPT的整體超越,醫(yī)療領(lǐng)域更是超越GPT-4。而在更早的星火V2.0那一版本,知名科技媒體《麻省理工科技評(píng)論》就對(duì)中國(guó)四款主流大模型進(jìn)行橫評(píng),結(jié)果訊飛星火力壓群雄,被評(píng)為“最聰明”的中國(guó)大模型。
就在WAIC前夕,6月27日,全新升級(jí)的訊飛星火V4.0如約而至,科大訊飛交出訊飛星火下半年的“成績(jī)單”:8個(gè)國(guó)際權(quán)威測(cè)試集測(cè)評(píng)第一,整體超越GPT-4 Turbo。在發(fā)布會(huì)上,科大訊飛根據(jù)《通用認(rèn)知智能大模型評(píng)測(cè)體系》構(gòu)建測(cè)試集,結(jié)果顯示訊飛星火V4.0在文本生成、語(yǔ)言理解、知識(shí)問答、邏輯推理、數(shù)學(xué)能力等維度全面超越GPT-4 Turbo,代碼與多模態(tài)能力也大幅提升。而在國(guó)際組織的12項(xiàng)測(cè)試集對(duì)比中,訊飛星火V4.0也實(shí)現(xiàn)了8項(xiàng)超越,其中理解與推理能力在四大機(jī)構(gòu)測(cè)試中取得“全勝”戰(zhàn)績(jī),該能力也是大模型最基礎(chǔ)、卻又最核心的能力,可以幫助AI思考、分析、理解和掌握事物的本質(zhì)和運(yùn)作規(guī)律,訊飛星火實(shí)力捍衛(wèi)“國(guó)產(chǎn)最強(qiáng)大模型”站位。
全新升級(jí)后的訊飛星火V4.0“智商”再進(jìn)化,在上個(gè)月結(jié)束的中高考實(shí)測(cè)中,訊飛星火語(yǔ)數(shù)外各科“成績(jī)”均排名第一,被業(yè)界評(píng)為“更會(huì)做題的大模型”。全國(guó)中小學(xué)生作文競(jìng)賽評(píng)委呂政嘉和河南省基礎(chǔ)教育教學(xué)專家?guī)斐蓡T李來明共同選取了新課標(biāo)I卷高考作文、新課標(biāo)II卷作文、北京高考(1)和(2)卷作文這四張?jiān)囶}“刁難”7款大模型,結(jié)果訊飛星火作出的《問,豈可少?》得到51.5的最高分,不僅思路清晰,而且鞭辟入里,發(fā)人深省。而在新京報(bào)對(duì)星火V4.0與GPT-4o進(jìn)行的中考作文實(shí)測(cè)中,星火V4.0以36.5平均分力壓GPT-4o。
除了在底座能力上對(duì)標(biāo)國(guó)際領(lǐng)先水平,具體到大模型的落地打法和實(shí)用性,訊飛星火還走出了一條自己獨(dú)特的發(fā)展路線,讓大模型從“通用AI助手”躍遷到“懂你的AI助手”,開啟大模型“私人定制”時(shí)代,讓大模型更好用、更實(shí)用、更具“個(gè)性化”。訊飛星火V4.0版本全新發(fā)布“個(gè)人空間”功能,用戶可以上傳自己的工作、學(xué)習(xí)、生活、健康等各類資料,形成每個(gè)人的專屬知識(shí)庫(kù),再結(jié)合人設(shè),讓大模型生成更個(gè)性化內(nèi)容。此外,訊飛星火首批上線 14 個(gè)智能體,面向特定場(chǎng)景打造專屬助手。
同時(shí)訊飛星火作為業(yè)界首個(gè)支持長(zhǎng)視頻、長(zhǎng)文本、長(zhǎng)語(yǔ)音的大模型,訊飛星火V4.0版本的長(zhǎng)文本能力也全新升級(jí),并針對(duì)長(zhǎng)文檔知識(shí)問答的幻覺問題,業(yè)界首發(fā)了溯源功能,大大提升大模型工作、學(xué)習(xí)“可用性”。
軟硬一體化落地 解決大模型應(yīng)用的“最后一公里”
一款大模型的產(chǎn)業(yè)價(jià)值,不僅要看算力與算法等數(shù)據(jù)參數(shù),更要看如何與垂直行業(yè)進(jìn)行結(jié)合,以及產(chǎn)品在剛需場(chǎng)景下如何落地。同時(shí)大模型與行業(yè)結(jié)合時(shí)二次開發(fā)、對(duì)接成本盡可能要小,否則就是中看不中用的“繡花枕頭”?拼笥嶏w采取的策略是,用更小的算力、更高的效率,來打造企業(yè)專屬大模型。并通過軟硬一體化協(xié)同,讓大模型由虛向?qū),從落地深耕邁向落地“生根”。
具體來看,科大訊飛基于云邊端一體化和軟硬件一體化,在智能家電、智能汽車、運(yùn)營(yíng)商、機(jī)器人等行業(yè)場(chǎng)景實(shí)現(xiàn)全面賦能。比如科大訊飛與奇瑞聯(lián)合打造的星紀(jì)元ET智慧座艙,就通過星火大模型作為智慧中臺(tái),打通了心率傳感器等內(nèi)外部設(shè)備,可以對(duì)司機(jī)進(jìn)行心率監(jiān)測(cè)提醒,確保長(zhǎng)途行車安全。還有業(yè)界首發(fā)的星火智能批閱機(jī),看似打印機(jī)的外表,卻擁有自動(dòng)批改試卷的“魔力”,讓老師減負(fù)增效,將更多精力投入到學(xué)生的五育教育上。
面向更多行業(yè)場(chǎng)景,訊飛還以企業(yè)智能體的方式,面向特定行業(yè)、特定場(chǎng)景打造專屬AI助手,訊飛星火V4.0發(fā)布會(huì)現(xiàn)場(chǎng)正式發(fā)布星火企業(yè)智能體平臺(tái)。據(jù)了解,圍繞搭建智能體的三大關(guān)鍵能力,當(dāng)前星火企業(yè)智能體平臺(tái)已覆蓋400+AI原子能力,集成90+外部信源,打通100+內(nèi)部IT系統(tǒng),可供企業(yè)結(jié)合業(yè)務(wù)場(chǎng)景快速構(gòu)建可落地的智能體應(yīng)用。平臺(tái)還圍繞生產(chǎn)域、科創(chuàng)域、辦公域、管理域上線32個(gè)企業(yè)智能體,供企業(yè)即插即用。星火企業(yè)智能體平臺(tái)打通了場(chǎng)景價(jià)值落地的最后一公里,也幫助企業(yè)打通了大模型應(yīng)用的最后一公里。
正是憑借真正的實(shí)用與好用,使得星火深受企業(yè)歡迎。根據(jù)數(shù)智前線披露的2024上半年大模型招投標(biāo)情況,科大訊飛成為了外部訂單數(shù)量最多的“標(biāo)王”,央國(guó)企為代表的行業(yè)客戶成為星火最大客群。在訊飛星火構(gòu)建的大模型算力底座下,企業(yè)可以根據(jù)自身業(yè)務(wù)需求去匹配不同的算力,用最小的算力實(shí)現(xiàn)更高的效率,也就是“殺雞焉用宰牛刀”的邏輯,最終實(shí)現(xiàn)效率最大化與效益最優(yōu)化。
再回到本屆WAIC,今年大模型參展數(shù)量多達(dá)百款,多家廠商帶來了產(chǎn)品和技術(shù)“首秀”,再次讓“百模大戰(zhàn)”得以具象化,在現(xiàn)場(chǎng)你會(huì)感受到大模型賽道的蓬勃生機(jī),同時(shí)也暗藏優(yōu)勝劣汰的殘酷競(jìng)爭(zhēng)。
對(duì)于國(guó)內(nèi)的大模型廠商來說,理性看待差距,堅(jiān)持長(zhǎng)期主義精神,是決勝關(guān)鍵。在國(guó)際人工智能拉力賽中,國(guó)產(chǎn)大模型在迎頭追趕的同時(shí),對(duì)方也在快速迭代,只有正視差距,才有機(jī)會(huì)趕超。在訊飛星火V4.0發(fā)布會(huì)上,科大訊飛董事長(zhǎng)劉慶峰說道:“我們既要科學(xué)理性地認(rèn)識(shí)中美在大模型上的綜合差距,也要有信心快速追趕,給出從源頭技術(shù)、到產(chǎn)業(yè)生態(tài)、再到應(yīng)用落地的一整套的打法,以長(zhǎng)期主義來打造真正自主可控的AI產(chǎn)業(yè)生態(tài)!
劉慶峰坦言,訊飛星火V4.0已經(jīng)實(shí)現(xiàn)了GPT-4 Turbo的對(duì)標(biāo),在文本生成、語(yǔ)言理解、知識(shí)問答、邏輯推理、數(shù)學(xué)這些能力上都已經(jīng)實(shí)現(xiàn)超越,但在代碼和多模態(tài)能力上還有差距。代碼是連接虛擬世界和物理世界的橋梁,這個(gè)能力是中國(guó)大模型一定要搶占的核心能力。在訊飛星火V4.0發(fā)布會(huì)上,科大訊飛也介紹了代碼領(lǐng)域的最新進(jìn)展:持續(xù)迭代的代碼智能體iFlyCode集成了代碼生成助手、架構(gòu)設(shè)計(jì)助手、代碼問答助手、測(cè)試助手、數(shù)據(jù)庫(kù)優(yōu)化助手、代碼審核助手等六大場(chǎng)景智能體,將采納率由30%提升至52%,大幅度提升企業(yè)智能體的實(shí)用性。據(jù)了解,代碼智能體已在銀行、家電等行業(yè)在內(nèi)的100多家企業(yè)以“AI程序員”的身份上崗。以交通銀行為例,基于星火大模型能力的產(chǎn)品iFlyCode覆蓋6000+研發(fā)人員,代碼采納率達(dá)38%,工作效率顯著提升。
劉慶峰表示,代碼能力是科大訊飛非常關(guān)注的能力之一,因?yàn)樗婕拔磥淼漠a(chǎn)業(yè)信息化和信息產(chǎn)業(yè)化的核心,而ChatGPT去年2月份通過谷歌二級(jí)程序員測(cè)試,當(dāng)時(shí)的GPT-3.5用這個(gè)測(cè)試集只獲得了60多分,GPT-4 Turbo今年1月份測(cè)試大概在80分,現(xiàn)在到86分,也在快速迭代和進(jìn)步?拼笥嶏w預(yù)計(jì)在今年8月份,訊飛星火將達(dá)到86分以上的水平。
隨著訊飛星火V4.0重磅發(fā)布以及在WAIC上的升級(jí)后“首秀”,可以窺見訊飛星火作為國(guó)產(chǎn)大模型代表,已在技術(shù)底座、商業(yè)化落地等方面彰顯出引領(lǐng)性。未來,在以商業(yè)落地為重頭戲的后半場(chǎng),隨著AI助手的持續(xù)打造以及一系列的落地動(dòng)作,無疑都會(huì)助其再次占領(lǐng)行業(yè)競(jìng)爭(zhēng)的先機(jī)。