首頁(yè)|必讀|視頻|專訪|運(yùn)營(yíng)|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁(yè) >> 頭條資訊 >> 正文

文心一言數(shù)學(xué)和中文理解能力全球第?清華最新報(bào)告出爐

2024年4月22日 07:03  CCTIME飛象網(wǎng)  

4月21日,由清華大學(xué)基礎(chǔ)模型研究中心聯(lián)合中關(guān)村實(shí)驗(yàn)室研制的SuperBench大模型綜合能力評(píng)測(cè)框架,正式對(duì)外發(fā)布2024年3月版《SuperBench大模型綜合能力評(píng)測(cè)報(bào)告》,結(jié)果顯示:文心一言4.0表現(xiàn)亮眼,與國(guó)際一流模型水平接近,且差距已經(jīng)逐漸縮小。

在人類(lèi)對(duì)齊能力評(píng)測(cè)中,文心一言4.0位居國(guó)內(nèi)第一;中文理解上,文心一言4.0領(lǐng)先第二名GLM-4 0.41分,GPT-4系列模型表現(xiàn)較差,和文心一言4.0分差超過(guò)1分。

在語(yǔ)義理解中的數(shù)學(xué)能力上,文心一言4.0與Claude-3并列全球第一; GPT-4系列模型位列第四五,其他模型得分在55分附近較為集中;在語(yǔ)義理解中的閱讀理解能力上,文心一言4.0超過(guò)GPT-4 Turbo、Claude-3以及GLM-4拿下榜首。

在安全性評(píng)測(cè)上,國(guó)內(nèi)模型文心一言4.0拿下最高分(89.1分),Claude-3僅列第四。

據(jù)悉,自文心一言首發(fā)至今,用戶數(shù)已突破2億。

編 輯:高靖宇
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問(wèn)題,請(qǐng)?jiān)?0日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
聞庫(kù):全球6G發(fā)展需要統(tǒng)一的思路、方向和目標(biāo)
精彩專題
CES 2024國(guó)際消費(fèi)電子展
2023年信息通信產(chǎn)業(yè)盤(pán)點(diǎn)暨頒獎(jiǎng)禮
飛象網(wǎng)2023年手機(jī)評(píng)選
第24屆中國(guó)國(guó)際光電博覽會(huì)
CCTIME推薦
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱: 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書(shū)面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像