來源:財聯(lián)社
當?shù)貢r間周三,美國科技巨頭谷歌(131.43, -0.96, -0.73%)宣布推出其認為規(guī)模最大、功能最強大的人工智能模型Gemini,這種技術(shù)能夠處理視頻、音頻和文本等不同內(nèi)容形式的信息。
谷歌表示,該公司備受期待的人工智能模型名為Gemini,對比之前的技術(shù),能夠進行更復(fù)雜的推理,理解更加細微的信息。它通過閱讀、過濾和理解信息,可以從數(shù)十萬份文件中提取要點,將有助于在從科學到金融的許多領(lǐng)域?qū)崿F(xiàn)新的突破。
谷歌首席執(zhí)行官桑達爾·皮查伊在一篇博文中寫道:“這個新模型代表了我們作為一家科技公司所做的最大的科學和工程努力之一,它也是一個多模態(tài)基礎(chǔ)模型,可以概括和理解不同類型的信息,包括文本、代碼、音頻、圖像和視頻。”
自O(shè)penAI一年前推出ChatGPT以來,谷歌一直在努力開發(fā)能夠與這家公司相抗衡的人工智能軟件。谷歌聲稱,已經(jīng)在其人工智能助手Bard上添加了部分Gemini模型的技術(shù),并表示計劃在明年年初將最先進的Gemini模型完全融入到Bard中。
谷歌高管們認為,Gemini Pro的表現(xiàn)優(yōu)于GPT-3.5,但回避了與GPT-4相比如何的問題。而在今年3月,OpenAI推出了GPT-4。
這家科技公司表示,將發(fā)布三種版本的Gemini,分別為Gemini Ultra、Gemini Pro和Gemini Nano。每個版本具有不同的信息處理能力,功能最強大的Gemini Ultra版本是為在數(shù)據(jù)中心運行而設(shè)計的,最弱的Gemini Nano版本將在移動設(shè)備上高效運行。
從12月13日開始,開發(fā)者和企業(yè)客戶可以通過Google AI Studio或Google Cloud Vertex AI中的Gemini API訪問Gemini Pro。Android開發(fā)者也可以使用Gemini Nano進行軟件開發(fā)。
DeepMind負責產(chǎn)品的副總裁Eli Collins聲稱,Gemini是谷歌DeepMind人工智能部門幫助創(chuàng)造的最強大的人工智能模型,但與該公司之前的大模型相比,它為用戶提供的服務(wù)“明顯”更加便宜。
Collins補充說:“因此,Gemini不僅功能更強,效率也高得多。最新的模型仍然需要大量的計算能力來訓練,谷歌正在快速推進這一過程!
谷歌還發(fā)布了其最強大的人工智能芯片Cloud TPU v5p,它是在之前的版本基礎(chǔ)上進行的改進。根據(jù)谷歌的說法,與TPU v4相比,TPU v5p的浮點運算性能提升了兩倍,它訓練大語言模型的速度比TPU v4快2.8倍。