首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|智能汽車|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 人工智能 >> 正文

OpenAI“下一個重大突破” 首個AI助理產(chǎn)品或明年1月發(fā)布 人機交互變革已至?

2024年11月14日 13:59  財聯(lián)社  作 者:宋子喬

據(jù)媒體報道,OpenAI正準備推出一款代號為“Operator”的全新AI助理產(chǎn)品,可以自動執(zhí)行各種復(fù)雜操作,包括編寫代碼、預(yù)訂旅行、自動電商購物等。根據(jù)內(nèi)部員工爆料,OpenAI領(lǐng)導(dǎo)層預(yù)計將在2025年1月發(fā)布該產(chǎn)品,首先作為研究預(yù)覽版和開發(fā)工具推出,屆時將為開發(fā)人員開放API接口。

報道稱,OpenAI一直在進行幾個與智能體相關(guān)的研究項目。其中一位人士表示,最接近完成的將是一個在網(wǎng)絡(luò)瀏覽器中執(zhí)行任務(wù)的通用工具。

AI助理(AI Agent)是一種能夠感知環(huán)境、進行決策和執(zhí)行動作的智能實體,具備通過獨立思考、調(diào)用工具去逐步完成給定目標的能力,既能為C端提供個性化應(yīng)用,也能為B端提供降本增效方案。對于普通用戶而言,AI助理最核心的功能是AI自主操作手機,輔助完成復(fù)雜推理任務(wù)。

OpenAI首席執(zhí)行官阿爾特曼早已透露下場意愿。幾周前,他在Reddit的“問我任何問題”(Ask Me Anything)論壇上表示,“我們將擁有越來越好的模型,但我認為下一個重大突破將是AI助手!痹谏蟼月公司年度開發(fā)日之前的OpenAI新聞發(fā)布會上,該公司首席產(chǎn)品官Kevin Weil稱:“我認為2025年將是Agent系統(tǒng)最終進入主流的一年。”

站在OpenAI的角度,其在商業(yè)化進程中面臨著越來越大的壓力, ChatGPT漸進式的改進可能無法吸引用戶支付更高的價格。高管急切需要一款突破性產(chǎn)品,以證明對AI開發(fā)的巨額投資是值得的。

目前,OpenAI已開源了多功能協(xié)同AI Agent——Swarm,可創(chuàng)建多個智能體協(xié)同工作,以更高效地完成任務(wù)。其GPT o1模型增強了推理能力,使其在復(fù)雜問題的解決和用戶交互的自然性方面均有顯著進步,亦使其更加適用于AI Agent場景。

AI助理被視作通往AGI的核心基礎(chǔ),在硬件廠商言必稱AI的時代,AI助理或成為終端智能化的突破口。甬興證券表示,AI Agent或?qū)⒄莆找苿踊ヂ?lián)新入口,流量分發(fā)格局有望重塑AI Agent智能體因具備較強交互性以及便利性,或可打通原先同個終端不同App之間的天然壁壘。

據(jù)《科創(chuàng)板日報》不完全梳理,國內(nèi)外頭部廠商正爭先推出AI助理產(chǎn)品——

微軟近期低調(diào)開源了AI工具OmniParser,其可幫助用戶創(chuàng)建個性化智能體,以操作個人計算機;10月22日,微軟宣布在Dynamics 365中集成10個自主AI Agent,支持OpenAI最新模型o1,具備自主學(xué)習(xí)能力,可自動執(zhí)行跨平臺復(fù)雜業(yè)務(wù);9月,微軟推出了一款名為Windows Agent Arena的基準框架,同樣屬于AI助理開發(fā)范疇。

據(jù)The Information報道,谷歌計劃在12月預(yù)覽其大型動作模型“Project Jarvis”,該項目將幫助用戶執(zhí)行諸如“收集研究、購買產(chǎn)品或預(yù)訂航班”等任務(wù)。

10月22日,Anthropic為大模型Claude迭代了新功能——Computer Use,讓AI可以像人一樣操控電腦。Claude3.5 Sonnet是首個支持計算機控制的模型,能夠模擬人類操作計算機,包括移動光標、點擊按鈕和輸入文本。

蘋果選擇將Siri與ChatGPT集成,實現(xiàn)更智能的人機交互,另有網(wǎng)友發(fā)現(xiàn)蘋果已經(jīng)默默發(fā)布了Ferret-UI的兩個實現(xiàn)版本(分別基于Gemma 2B和Llama 8B),這是蘋果今年5月發(fā)布的一個可讓AI理解手機屏幕的技術(shù)。

華為則公布了一項可讓AI像人類一樣操作手機的新研究成果,相關(guān)團隊提出了一個手機控制架構(gòu):Lightweight Multi-modal App Control(輕量級多模態(tài)應(yīng)用控制,簡稱LiMAC)。

中國獨角獸企業(yè)智譜AI已上線AI助理工具AutoGLM,無需手動操作,用戶對著手機說話(發(fā)出指令),便可讓其自動打開手機上的各類App,進行網(wǎng)購、點外賣、訂高鐵票,甚至發(fā)微信、搶紅包、評論朋友圈、整理筆記并生成攻略、總結(jié)論文。

中信證券表示,AutoGLM等終端AI助理技術(shù)將帶來更短路徑的交互形式,接受語音指令并自動完成復(fù)雜操作的能力將為消費者帶來極大便利,其有望成為AI終端的亮點功能并吸引消費者升級換代。

華泰證券也表示,AI助理落地將帶來多個層次的產(chǎn)業(yè)機遇,其中,Agent+終端有望推動人機交互變革,除了在終端銷售量價方面的變化外,可能對終端應(yīng)用的商業(yè)模式產(chǎn)生更加深遠的影響。

編 輯:章芳
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
愛立信中國區(qū)總裁方迎:新質(zhì)網(wǎng)絡(luò)創(chuàng)造新質(zhì)價值
精彩專題
2024中國算力大會
2024年國際信息通信展
中國信科亮相2024年國際信息通信展
第25屆中國國際光電博覽會
CCTIME推薦
關(guān)于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像