首頁|必讀|視頻|專訪|運(yùn)營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片|報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁 >> 頭條資訊 >> 正文

什么是開源AI?官方定義終于來了 Meta Llama模型沒過關(guān)

2024年10月29日 08:42  華爾街見聞  

長期致力于定義和“管理”所有開源事務(wù)的開放源代碼倡議(OSI),周一發(fā)布了其開源AI定義(OSAID)1.0版。根據(jù)OSAID,AI模型若要被視為開源,必須提供足夠的信息,使任何人都可以“實(shí)質(zhì)性地”重建該模型。模型還必須披露與其訓(xùn)練數(shù)據(jù)相關(guān)的任何重要細(xì)節(jié),包括數(shù)據(jù)的來源、處理方式以及獲取或許可的方式。然而,Meta并不認(rèn)可這一定義,認(rèn)為不存在單一的開源AI定義。

開源AI終于有了“官方”定義。

長期致力于定義和“管理”所有開源事務(wù)的開放源代碼倡議(OSI),周一發(fā)布了其開源AI定義(OSAID)1.0版。根據(jù)OSAID,AI模型若要被視為開源,必須提供足夠的信息,使任何人都可以“實(shí)質(zhì)性地”重建該模型。模型還必須披露與其訓(xùn)練數(shù)據(jù)相關(guān)的任何重要細(xì)節(jié),包括數(shù)據(jù)的來源、處理方式以及獲取或許可的方式。

OSAID還列出了開發(fā)者使用開源AI時(shí)應(yīng)享有的使用權(quán),例如可以為任何目的使用和修改模型,而無需獲得他人許可。

OSI執(zhí)行副總裁Stefano Maffulli表示,制定開源AI官方定義主要目的是,讓政策制定者和AI開發(fā)者達(dá)成一致。

“監(jiān)管機(jī)構(gòu)已經(jīng)在關(guān)注這一領(lǐng)域。我們明確向各方利益相關(guān)者和社區(qū)進(jìn)行了推廣,甚至還試圖聯(lián)系那些經(jīng)常與監(jiān)管機(jī)構(gòu)交流的組織,來獲取早期反饋。”

“開源AI是一種允許你完全理解其構(gòu)建方式的AI模型,這意味著你可以訪問所有組件,比如用于訓(xùn)練和數(shù)據(jù)過濾的完整代碼。最重要的是,你應(yīng)該能夠在其基礎(chǔ)上構(gòu)建。”

OSI并不強(qiáng)制施壓開發(fā)者遵守OSAID定義,但打算對(duì)那些不符合該定義卻被描述為“開源”的模型進(jìn)行標(biāo)記!拔覀兿M(dāng)有人試圖濫用這個(gè)術(shù)語時(shí),AI社區(qū)會(huì)說,‘我們不承認(rèn)這是開源’,并加以糾正。”Maffulli說道。

Meta:我反對(duì)

目前,許多初創(chuàng)企業(yè)和大型科技公司,尤其是Meta,稱其AI模型發(fā)布策略為“開源”,但很少符合OSAID的標(biāo)準(zhǔn)。研究人員發(fā)現(xiàn),許多“開源”模型實(shí)際上只是名義上開源,但實(shí)際訓(xùn)練模型所需的數(shù)據(jù)是保密的,而且運(yùn)行這些模型所需要的計(jì)算能力超出了許多開發(fā)者的能力范圍。

例如,Meta要求月活躍用戶超過7億的平臺(tái)獲得特殊許可才能使用其Llama模型。Maffulli公開批評(píng)Meta將其模型稱為“開源”的做法。而谷歌(168.34, 1.35, 0.81%)和微軟(426.59, -1.56, -0.36%)在與OSI討論后,已經(jīng)同意不再將不完全開放的模型稱為“開源”,但Meta并未這么做。

此外,長期宣傳其模型為“開源”的Stability AI要求年收入超過100萬美元的企業(yè)獲得企業(yè)許可,而法國AI新創(chuàng)公司Mistral的許可證則禁止將某些模型和輸出用于商業(yè)用途。

Meta自然不認(rèn)同這一評(píng)估。盡管該公司參與了定義的起草過程,但對(duì)OSAID的措辭表示異議。Meta發(fā)言人稱,Llama的許可條款和隨附的可接受使用政策對(duì)有害應(yīng)用提供了防護(hù)。Meta還表示,在加州AI相關(guān)法規(guī)正在演變之際,該公司對(duì)共享模型細(xì)節(jié)的做法是“謹(jǐn)慎的”。

“我們?cè)谠S多方面與OSI的伙伴立場一致,但我們以及業(yè)內(nèi)其他公司都不同意他們的新定義,我們認(rèn)為沒有單一的開源AI定義,因?yàn)檫^去的開源定義無法涵蓋當(dāng)今迅速發(fā)展的AI模型的復(fù)雜性。我們讓Llama免費(fèi)公開使用,并通過許可和使用政策來確保安全。無論技術(shù)定義如何,我們將繼續(xù)與OSI和其他行業(yè)團(tuán)體合作,增加免費(fèi)AI使用的便利程度!

分析認(rèn)為,Meta不愿公開訓(xùn)練數(shù)據(jù),很可能與其自身及大多數(shù)AI模型的開發(fā)方式有關(guān)。

AI公司從社交媒體和網(wǎng)站上收集大量圖像、音頻和視頻等數(shù)據(jù),并以這些“公開可用數(shù)據(jù)”訓(xùn)練模型。在如今競爭激烈的市場中,數(shù)據(jù)集的收集和優(yōu)化方法被視為競爭優(yōu)勢,公司常以此為由拒絕披露。

但訓(xùn)練數(shù)據(jù)的細(xì)節(jié)也可能讓開發(fā)者面臨法律風(fēng)險(xiǎn)。作者和出版商聲稱,Meta使用了受版權(quán)保護(hù)的書籍進(jìn)行訓(xùn)練。藝術(shù)家們也對(duì)Stability AI提起訴訟,指控其使用其作品而未給予認(rèn)可,將其行為比作盜竊。

因此,OSAID的開源AI定義,可能會(huì)給那些試圖順利解決訴訟的公司帶來問題,特別是如果原告和法官認(rèn)為該定義足夠合理而在法庭上引用。

 

編 輯:路金娣
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過授權(quán)可以轉(zhuǎn)載,請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
中國電信李峻:只有當(dāng)人工智能成為公共基礎(chǔ)設(shè)施,才能普惠大眾
精彩專題
2024中國算力大會(huì)
2024年國際信息通信展
中國信科亮相2024年國際信息通信展
第25屆中國國際光電博覽會(huì)
CCTIME推薦
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱: 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像