首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|低空經(jīng)濟(jì)|智能汽車|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 人工智能 >> 正文

Meta發(fā)布首批Llama 4大模型,谷歌CEO:AI世界永不無聊

2025年4月7日 07:25  第一財經(jīng)  

當(dāng)?shù)貢r間4月5日,Meta公司發(fā)布了最新的開源人工智能軟件Llama 4的首批大模型版本Llama 4 Scout和Llama 4 Maverick。這也是該公司迄今為止最強(qiáng)大的兩款A(yù)I大型語言模型(LLM)。

不過Meta表示,更強(qiáng)大的一款被命名為Llama 4 Behemoth的大模型仍在訓(xùn)練中,該模型將在Meta的混合專家模型(MoE)架構(gòu)中充當(dāng)“新模型的老師”。

這也是Meta基于Llama軟件首次采用的MoE模型架構(gòu)。在MoE模型中,單個token僅激活總參數(shù)的一部分。Meta表示,MoE架構(gòu)在訓(xùn)練和推理時計算效率更高,在固定訓(xùn)練FLOPs預(yù)算下,相比密集模型提供更高的質(zhì)量。

以Llama 4 Maverick模型為例,該模型擁有170億激活參數(shù)和4000億總參數(shù)。Meta采用交替的密集層和混合專家(MoE)層來提高推理效率。在這種方式下,盡管所有參數(shù)都存儲在內(nèi)存中,但在服務(wù)這些模型時,只有總參數(shù)的一部分被激活。

Meta最新大模型的發(fā)布也意味著科技巨頭在生成式人工智能大潮中的投資競賽進(jìn)一步升級。此前有報道稱,Meta推遲了大模型最新版本的發(fā)布,因為在開發(fā)過程中,Llama 4 在技術(shù)基準(zhǔn)方面沒有達(dá)到Meta的期望,特別是在推理和數(shù)學(xué)任務(wù)方面。

“我們的目標(biāo)是打造世界領(lǐng)先的人工智能,將其開源,并使其普遍可用,讓世界上的每個人都能從中受益!盡eta公司創(chuàng)始人CEO馬克·扎克伯格在Instagtam上的一段視頻中說道,“我認(rèn)為開源人工智能軟件將構(gòu)建出領(lǐng)先的模型,而隨著Llama 4的出現(xiàn),這種情況開始發(fā)生了。”

谷歌CEO桑達(dá)爾·皮查伊(Sundar Pichai)也在社交媒體上就Llama最新模型的發(fā)布表示祝賀。他說道:“人工智能的世界永遠(yuǎn)不會無聊!祝賀Llama團(tuán)隊,繼續(xù)前進(jìn)!”

此外,Meta將于4月29日舉辦首屆LlamaCon AI大會。該公司預(yù)計還將在今年第二季度推出Meta AI聊天機(jī)器人的獨立應(yīng)用程序。

Meta公司首席產(chǎn)品官Chris Cox上個月表示,Llama 4將推動AI智能體(AI Agent)的發(fā)展,使其具備更高水平的推理和行動能力。這些AI智能體將能上網(wǎng)并處理大量對消費者和企業(yè)有用的任務(wù)。

與此同時,Meta正在對AI基礎(chǔ)設(shè)施進(jìn)行大量投入。該公司計劃今年斥資650億美元擴(kuò)建AI基礎(chǔ)設(shè)施,其中可能包括一個耗資近10億美元在美國威斯康星州中部建立的數(shù)據(jù)中心項目。

不過,就在Meta新模型發(fā)布之前,該公司人工智能研究主管喬爾·皮諾(Joelle Pineau)上周宣布離職。皮諾是Meta公司的頂尖人工智能研究人員之一,自2023年以來一直領(lǐng)導(dǎo)該公司的基礎(chǔ)人工智能研究部門(FAIR),負(fù)責(zé)公司的前沿計算機(jī)科學(xué)相關(guān)研究,包括Meta的開源Llama系列AI模型和其他技術(shù)。

編 輯:高靖宇
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
中興通訊董事長李自學(xué):算力筑基、 AI 啟智,共迎數(shù)智化新紀(jì)元
精彩專題
通信產(chǎn)業(yè)2024年業(yè)績盤點
3·15權(quán)益日 | 共筑滿意消費 守護(hù)信息通信安全防線
聚焦2025全國兩會
2025年世界移動通信大會
CCTIME推薦
關(guān)于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像