首頁(yè)|必讀|視頻|專(zhuān)訪|運(yùn)營(yíng)|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|低空經(jīng)濟(jì)|智能汽車(chē)|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片|報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁(yè) >> 頭條固定一 >> 正文

AI的瘋狂三月:本地能力再提升,云上掀起動(dòng)漫風(fēng)

2025年4月3日 07:24  CCTIME飛象網(wǎng)  作 者:魏德齡

飛象原創(chuàng)(魏德齡/文)剛剛過(guò)去的三月,人工智能的功能升級(jí)可謂一個(gè)爆款接著又一個(gè)爆款,無(wú)論是面向本地部署的Gemma,還是ChatGPT在社交媒體平臺(tái)上掀起的日式動(dòng)漫風(fēng)。假如說(shuō)以前的人工智能領(lǐng)域還是每年春節(jié)一爆款的話(huà),這次則是直接開(kāi)啟了“瘋狂三月”。

本地能力再提升

27B的參數(shù)量能力卻可以超過(guò)671B的模型,只需一張H100顯卡,就能在本地實(shí)現(xiàn)媲美云端的高效推理。谷歌開(kāi)源的最新多模態(tài)大模型Gemma-3在這個(gè)3月成為很多用戶(hù)的最新本地AI部署嘗試。

Gemma 3提供四種不同參數(shù)規(guī)模的選項(xiàng),分別為1B、4B、12B和27B參數(shù)。除了1B外,其他三種均支持多模態(tài),輕松構(gòu)建能夠分析圖像、文本和短視頻的應(yīng)用,開(kāi)啟交互式智能應(yīng)用的新可能。這一小參數(shù)量的特性能夠讓包括手機(jī)、筆記本電腦和工作站等設(shè)備在本地運(yùn)行高性能的模型。

從上圖不難發(fā)現(xiàn),Gemma 3在同等規(guī)模下展現(xiàn)了業(yè)界領(lǐng)先的性能,在LMArena榜單評(píng)估中超越了Llama3-405B、DeepSeek-V3和o3-mini。這意味著可以在單個(gè)GPU或TPU上部署媲美甚至超越云端AI的體驗(yàn)。

此外,Gemma 3具有強(qiáng)大的語(yǔ)言處理能力。其原生支持35種語(yǔ)言,并且預(yù)訓(xùn)練支持140多種語(yǔ)言,幫助開(kāi)發(fā)者構(gòu)建全球化的AI應(yīng)用。Gemma 3的128k-token超長(zhǎng)上下文窗口,使得AI模型能夠理解和處理更加復(fù)雜和海量的信息。這一能力的提升,使得本地AI能夠在處理長(zhǎng)文本、大規(guī)模數(shù)據(jù)分析等任務(wù)時(shí),展現(xiàn)出更強(qiáng)的處理能力,為需要高精度和高效能的行業(yè)應(yīng)用提供了有力支持。

Gemma 3還支持函數(shù)調(diào)用和結(jié)構(gòu)化輸出,幫助開(kāi)發(fā)者構(gòu)建智能工作流,進(jìn)一步簡(jiǎn)化AI應(yīng)用的開(kāi)發(fā)過(guò)程。這使得開(kāi)發(fā)者能夠更容易地構(gòu)建出符合特定需求的AI應(yīng)用,快速實(shí)現(xiàn)業(yè)務(wù)自動(dòng)化和智能化,提高工作效率。

阿里巴巴最近發(fā)布并開(kāi)源的Qwen2.5-Omni大模型同樣帶來(lái)了本地AI能力的又一次提升,作為首個(gè)端到端的全模態(tài)大模型,Qwen2.5-Omni能夠同時(shí)處理文本、圖像、音頻和視頻等多種輸入,并實(shí)時(shí)生成文本與自然語(yǔ)音合成輸出,顯著提升了AI在多維度、多感官的認(rèn)知與交互能力。

輕量級(jí)的設(shè)計(jì)同樣是Qwen2.5-Omni的一大亮點(diǎn),能夠以?xún)H7B參數(shù)的小尺寸展現(xiàn)了同樣強(qiáng)大的性能,即便在手機(jī)上,也能輕松部署和應(yīng)用Qwen2.5-Omni模型。當(dāng)前,Qwen2.5-Omni已在魔搭社區(qū)和Hugging Face同步開(kāi)源。

根據(jù)測(cè)試成績(jī)顯示,Qwen2.5-Omni全維度超Google的Gemini-1.5-Pro等同類(lèi)模型,刷新業(yè)界紀(jì)錄。這一表現(xiàn)意味著,Qwen2.5-Omni不僅具備強(qiáng)大的處理能力,還能更智能、更自然地應(yīng)對(duì)復(fù)雜任務(wù)。在面對(duì)多感官輸入時(shí),Qwen2.5-Omni能夠模擬人類(lèi)的認(rèn)知方式,通過(guò)音視頻識(shí)別情緒,做出更加精準(zhǔn)、富有情感的反饋與決策。

端側(cè)AI繼續(xù)著著小規(guī)模高性能的目標(biāo)前進(jìn),而云端AI更是在3月成為網(wǎng)紅級(jí)別的存在,在全網(wǎng)掀起了一波又一波的P圖秀。

云上掀起動(dòng)漫風(fēng)

其實(shí)在ChatGPT 4o掀起線(xiàn)上動(dòng)漫風(fēng)之前,Google在擴(kuò)大了Gemini 2.0 Flash模型圖像生成功能的訪問(wèn)權(quán)限后,就已經(jīng)讓人們感受了AI修圖的強(qiáng)大實(shí)力。其中一項(xiàng)重大功能便是能夠去除圖片中的水印,對(duì)于水印過(guò)多的圖片,甚至還能?chē)L試填補(bǔ)因水印刪除而產(chǎn)生的空白區(qū)域。

當(dāng)然,這一強(qiáng)大的功能也引來(lái)了業(yè)界對(duì)于版權(quán)問(wèn)題的擔(dān)憂(yōu),其中一大問(wèn)題就在于付費(fèi)照片的銷(xiāo)售。一些線(xiàn)上拍照服務(wù),會(huì)以水印的形式呈現(xiàn)給用戶(hù)照片圖片,通過(guò)后續(xù)付費(fèi)來(lái)解鎖無(wú)水印的原圖。然而隨著這一高效且強(qiáng)大的去水印功能出現(xiàn),無(wú)疑會(huì)讓很多公司產(chǎn)生疑慮。

同樣是在3月,ChatGPT 4o也帶來(lái)了一波圖像能力的升級(jí)更新,推出基于GPT-4o模型的原生圖像生成功能,不再調(diào)用獨(dú)立的DALL-E文生圖模型。利用GPT-4o的多模態(tài)能力,ChatGPT在圖像生成時(shí)能更加精確地遵循指示、更精確地渲染圖像上的文字,同時(shí)支持多輪迭代優(yōu)化圖像時(shí)保持角色形象一致。

隨之被用戶(hù)發(fā)掘出最吸引人的功能便在于可以將用戶(hù)上傳的圖片,重新繪制成其他繪畫(huà)風(fēng)格的作品,其中尤以漫畫(huà)風(fēng)格最為討喜,于是,轉(zhuǎn)換生成的吉卜力風(fēng)格作品瞬間引爆互聯(lián)網(wǎng),用戶(hù)們不僅將自己的日常生活照片進(jìn)行轉(zhuǎn)換,還將重要?dú)v史時(shí)刻、網(wǎng)絡(luò)梗圖同樣進(jìn)行了轉(zhuǎn)換,ChatGPT 4o均能做到傳神般的寫(xiě)照。

此外,轉(zhuǎn)換出來(lái)的動(dòng)漫圖片,還能配合其他AI視頻生成工具,重制一些電影內(nèi)容,制作出新的動(dòng)畫(huà)短片。例如,國(guó)外AI影片創(chuàng)作者PJAce先通過(guò)ChatGPT 4o生成了102張魔戒電影預(yù)告片的轉(zhuǎn)換圖片,隨后又利用可靈進(jìn)行動(dòng)畫(huà)處理器,最終完整重現(xiàn)了一部吉卜力風(fēng)格的《魔戒首部曲:魔戒現(xiàn)身》預(yù)告片。

巨大的使用熱情也讓ChatGPT的算力開(kāi)始不堪重負(fù),OpenAI CEO Sam Altman在28日時(shí)表示:“該功能開(kāi)始暫時(shí)受限,我們的GPU正在‘融化’,Open AI正在嘗試優(yōu)化效率。”隨即,很多用戶(hù)也發(fā)現(xiàn)該功能已經(jīng)無(wú)法長(zhǎng)時(shí)間使用,甚至可能會(huì)直接拒絕生成以“吉卜力”為關(guān)鍵詞指令的請(qǐng)求。

人工智能上演的瘋狂三月,顯然大有一石激起千層浪的勢(shì)頭,端側(cè)模型的能力升級(jí),可能又將進(jìn)一步推動(dòng)一些企業(yè)的本地部署進(jìn)程。云端圖像能力的提升,仿佛又打開(kāi)了AI應(yīng)用的新世界的大門(mén),不過(guò)版權(quán)問(wèn)題也隨之而來(lái),修圖應(yīng)用公司也可能開(kāi)始心里發(fā)慌,但對(duì)于眾多使用者來(lái)說(shuō),無(wú)疑也度過(guò)了一個(gè)興奮嘗試的滿(mǎn)足三月。

編 輯:魏德齡
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來(lái)源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載,請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來(lái)源。
2.凡注明“來(lái)源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話(huà)為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
中興通訊董事長(zhǎng)李自學(xué):算力筑基、 AI 啟智,共迎數(shù)智化新紀(jì)元
精彩專(zhuān)題
3·15權(quán)益日 | 共筑滿(mǎn)意消費(fèi) 守護(hù)信息通信安全防線(xiàn)
聚焦2025全國(guó)兩會(huì)
2025年世界移動(dòng)通信大會(huì)
低空經(jīng)濟(jì)2025:助力中國(guó)經(jīng)濟(jì)騰飛,成就高質(zhì)量發(fā)展
CCTIME推薦
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱(chēng): 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書(shū)面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像