首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網|量子|元宇宙|博客|特約記者
手機|互聯(lián)網|IT|5G|光通信|人工智能|云計算|芯片報告|智慧城市|移動互聯(lián)網|會展
首頁 >> 人工智能 >> 正文

蘋果開放AI研究成果,發(fā)布多模態(tài)LLM模型Ferret

2023年12月25日 15:25  IT之家  作 者:遠洋

蘋果公司于 2023 年 10 月與哥倫比亞大學的研究人員合作發(fā)布了名為 Ferret(雪貂)的開源多模態(tài) LLM,但當時并沒有引起太多關注。

許多人工智能社區(qū)的人士都錯過了 Ferret 的發(fā)布,他們對蘋果意想不到地進入開源 LLM 領域表示歡迎,尤其是因為蘋果傳統(tǒng)上被認為是一個“封閉花園”。

今天早上,經營著一個專注于醫(yī)學領域開源人工智能的歐洲非營利組織的 Bart de Witte 在 X 上發(fā)帖:“我不知何故錯過了這一點,蘋果于 10 月加入了開源人工智能社區(qū)。Ferret 的推出證明了蘋果致力于影響深遠的人工智能研究,鞏固了其在多模態(tài)人工智能領域領導者的地位……ps:我期待著有一天,本地大型語言模型(LLLMs)作為重新設計的 iOS 的集成服務運行在我的 iPhone上!

科技博客作者和 VentureBeat 撰稿人 Ben Dickson 在 LinkedIn 上寫道:“2023 年你最意想不到的人工智能發(fā)展是什么?對我來說,這是蘋果發(fā)布開源 LLM(盡管是非商業(yè)許可)。”

Ferret 以非商業(yè)許可證開源,這意味著它目前的版本不能用于商業(yè)目的。然而,它未來有可能被用于蘋果未來的產品或服務中。蘋果 AI / ML 研究科學家 Zhe Gan 在今年 10 月的一條推文中解釋了 Ferret 的用途,稱它可以“在一個圖像中的任何地方、任何粒度上引用和定位任何事物”,它還可以使用圖像中任何形狀的區(qū)域來實現(xiàn)這一點。

簡單來說,F(xiàn)erret 可以檢查圖像上繪制的區(qū)域,識別其中的元素,并將其框選起來。然后,它可以將識別出的元素作為查詢的一部分,并以典型的方式進行響應。例如,用戶可以在圖像中突出顯示一只動物,并詢問其種類,F(xiàn)erret 可以識別出該動物的物種,并知道用戶指的是圖片中的一只特定動物。它還可以利用圖像中其他元素的上下文提供進一步的響應。

Ferret 的發(fā)布對研究人員來說意義重大,表明蘋果正在逐步開放其 AI 研究,這與其以往神秘封閉的形象形成了鮮明的對比。此外,蘋果也面臨著基礎設施方面的挑戰(zhàn)。雖然蘋果正在努力增加其擁有的 AI 服務器數(shù)量,但與 ChatGPT 等模型相比,其規(guī)?赡苋匀徊蛔恪3伺c其他公司合作擴展其能力之外,開源模型也是蘋果正在探索的另一條路徑。

一個有趣細節(jié)是,Reddit 的 r / Apple 版塊發(fā)現(xiàn) Ferret“使用了 8 個帶有 80GB 顯存的 A100 GPU 進行訓練”。鑒于蘋果過去與英偉達 GPU 的支持關系,這被視為蘋果對英偉達的罕見認可。

編 輯:章芳
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構成任何投資及應用建議。如網站內容涉及作品版權和其它問題,請在30日內與本網聯(lián)系,我們將在第一時間刪除內容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
工信部張云明:大部分國家新劃分了中頻段6G頻譜資源
精彩專題
專題丨“汛”速出動 共筑信息保障堤壩
2023MWC上海世界移動通信大會
中國5G商用四周年
2023年中國國際信息通信展覽會
CCTIME推薦
關于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網 CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業(yè)務經營許可證080234號 京公網安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經書面許可,禁止轉載、摘編、復制、鏡像