首頁|必讀|視頻|專訪|運(yùn)營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯(lián)網(wǎng)|會展

首頁 >> 人工智能 >> 正文

阿里通義Qwen2成斯坦福大模型榜單最強(qiáng)開源模型

2024年6月20日 15:37 環(huán)球網(wǎng)科技

6月20日消息，斯坦福大學(xué)的大模型測評榜單HELM MMLU發(fā)布最新結(jié)果，斯坦福大學(xué)基礎(chǔ)模型研究中心主任Percy Liang發(fā)文表示，阿里通義千問Qwen2-72B模型成為排名最高的開源大模型，性能超越Llama3-70B模型。

MMLU（Massive Multitask Language Understanding，大規(guī)模多任務(wù)語言理解）是業(yè)界最有影響力的大模型測評基準(zhǔn)之一，涵蓋了基礎(chǔ)數(shù)學(xué)、計算機(jī)科學(xué)、法律、歷史等57項(xiàng)任務(wù)，用以測試大模型的世界知識和問題解決能力。但在現(xiàn)實(shí)測評中，不同參評模型的測評結(jié)果有時缺乏一致性、可比性，原因包括使用非標(biāo)準(zhǔn)提示詞技術(shù)、沒有統(tǒng)一采用開源評價框架等等。

斯坦福大學(xué)基礎(chǔ)模型研究中心（CRFM，Center for Research on Foundation Models）提出的基礎(chǔ)模型評估框架HELM（A holistic framework for evaluating foundation models），旨在創(chuàng)造一種透明、可復(fù)現(xiàn)的評估方法。該方法基于HELM框架，對不同模型在MMLU上的評估結(jié)果進(jìn)行標(biāo)準(zhǔn)化和透明化處理，從而克服現(xiàn)有MMLU評估中存在的問題。比如，針對所有參評模型，都采用相同的提示詞；針對每項(xiàng)測試主題，都給模型提供同樣的5個示例進(jìn)行情境學(xué)習(xí)，等等。

日前，斯坦福大學(xué)基礎(chǔ)模型研究中心主任Percy Liang在社交平臺發(fā)布了HELM MMLU最新榜單，阿里巴巴的通義千問開源模型Qwen2-72B排名第5，僅次于Claude 3 Opus、GPT-4o、Gemini 1.5 pro、GPT-4，是排名第一的開源大模型，也是排名最高的中國大模型。

據(jù)悉，通義千問Qwen2于6月初開源，包含5個尺寸的預(yù)訓(xùn)練和指令微調(diào)模型，目前Qwen系列模型下載量已經(jīng)突破1600萬。

編輯：章芳

聲明：刊載本文目的在于傳播更多行業(yè)信息，本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問題，請在30日內(nèi)與本網(wǎng)聯(lián)系，我們將在第一時間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777，郵件后綴為#cctime.com，冒充本站員工以任何其他聯(lián)系方式，進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為，均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。

相關(guān)新聞

·OPPO小布助手改版升級 AI體驗(yàn)更近一步	·發(fā)展新質(zhì)生產(chǎn)力共享可持續(xù)未來——中國移動發(fā)布《2023..
·2024一季度國內(nèi)AR/VR出貨量同比下降37.8%	·低價或難挽救！最懂蘋果分析師：據(jù)觀察Vision Pro用幾..
·Orange正在向巴黎奧運(yùn)廣播商推介部署私有5G網(wǎng)絡(luò)	·生成式AI將在今年幫助Verizon挽留10萬用戶
·英偉達(dá)正開拓新業(yè)務(wù)，和戴爾等AI服務(wù)器制造商“搶飯吃”	·馬斯克：OpenAI的名字是我起的創(chuàng)建它為了對抗谷歌
·5G-A首個版本標(biāo)準(zhǔn)凍結(jié) 相關(guān)商用版圖正式展開	·中國電信發(fā)布全球首個單體稠密萬億參數(shù)語義模型Tele-FL..
·財政部、工信部進(jìn)一步支持專精特新中小企業(yè)高質(zhì)量發(fā)展	·關(guān)于傳送網(wǎng)升級擴(kuò)容節(jié)奏，韋樂平這樣說
·第一名！中信科移動中標(biāo)	·再創(chuàng)歷史新高！英偉達(dá)成為全球市值最高上市企業(yè)

人物

鄔賀銓：大模型下沉到手機(jī) 將激活萬億元規(guī)模手機(jī)產(chǎn)業(yè)

·劉慶峰：訊飛星火V4.0將提供多項(xiàng)G..

·中國移動設(shè)計院原副院長劉濤：6G..

·中國信通院胡堅波：頭部領(lǐng)先、以..

·中國鐵塔趙敬寶：筑牢數(shù)字基礎(chǔ)，..

·中國聯(lián)通傅強(qiáng)：推動移動通信高質(zhì)..

·中國移動邱寶華：續(xù)航5G+計劃擁..

精彩專題

CES 2024國際消費(fèi)電子展

2023年信息通信產(chǎn)業(yè)盤點(diǎn)暨頒獎禮

飛象網(wǎng)2023年手機(jī)評選

第24屆中國國際光電博覽會

CCTIME推薦

·財政部、工信部進(jìn)一步支持專精特..

·火“荔”全開背后的5G新“荔”量

·小折疊“不香了”都要放棄？趙明..

·烽火通信與中鐵十一局簽訂戰(zhàn)略合..

·NTT Docomo推進(jìn)從平流層提供5G，..

·蘋果公司計劃下個月在馬來西亞開..

·AT&T正在推進(jìn)一項(xiàng)廣泛的ORAN戰(zhàn)略

·T-Mobile美國宣布計劃以44億美元..

·英特爾GTC科技體驗(yàn)中心開幕，一站..

·助燃新質(zhì)生產(chǎn)力，江蘇移動啟動“A..

·中國石油與中國移動、華為公司、..

·1－4月我國軟件業(yè)務(wù)收入3.8萬億元..

·當(dāng)棉紡業(yè)遇上5G！有經(jīng)典味道，更..

·“人工智能+”行動，中國移動怎么..

·中國移動研究院“6G通感算智融合..

關(guān)于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1 電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號京公網(wǎng)安備110105000771號
公司名稱：北京飛象互動文化傳媒有限公司
未經(jīng)書面許可，禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像