近年來,隨著 ChatGPT 等多個(gè)聊天機(jī)器人進(jìn)入公共領(lǐng)域,生成式人工智能風(fēng)靡全球。聊天機(jī)器人以近乎神奇的速度生成類似人類的文本 - 以莎士比亞的風(fēng)格寫十四行詩,在多種語言之間翻譯文本,編寫計(jì)算機(jī)代碼等等。
企業(yè)和商業(yè)專家立即看到了潛在的好處。但最近幾個(gè)月,人們對(duì)生成式人工智能的質(zhì)疑日益增多。批評(píng)者表示,生成式人工智能的能力被夸大了。幻覺,也就是生成式人工智能模型可能產(chǎn)生的虛假陳述,降低了它的實(shí)用性,許多企業(yè)尚未找到使用這些工具的理想策略。盡管 ChatGPT 是有史以來增長最快的應(yīng)用程序之一,但經(jīng)常使用它的人比例仍然相當(dāng)?shù)汀?/P>
在IEEE最新發(fā)布的“ 2025 年及以后技術(shù)的影響:IEEE 全球研究”中,91% 的受訪者同意“到 2025 年,隨著公眾的興趣和看法轉(zhuǎn)變?yōu)閷?duì)這項(xiàng)技術(shù)可以和應(yīng)該做什么的更深入的理解和期望,將出現(xiàn)生成性人工智能清算,比如在結(jié)果的準(zhǔn)確性、深度偽造的透明度等方面。”
但調(diào)查結(jié)果并不認(rèn)為生成式人工智能會(huì)遭遇持久的阻礙。絕大多數(shù)人 (91%) 也同意“到 2025 年,生成式人工智能的創(chuàng)新、探索和采用將繼續(xù)以閃電般的速度發(fā)展!
那么,2025 年生成式人工智能將迎來什么?產(chǎn)品路線圖是什么?它們將對(duì)我們的工作和生活方式產(chǎn)生什么影響?
更多多模式功能
IEEE 高級(jí)會(huì)員林道莊預(yù)計(jì),未來幾年,生成式 AI 模型將使從短文本片段生成圖像和視頻變得更加容易。文本轉(zhuǎn)圖像、文本轉(zhuǎn)視頻和語音合成將得到改進(jìn),模型將在各種輸入之間實(shí)現(xiàn)更好的上下文理解。
“第一步是多模式的深度融合,為消費(fèi)者甚至專業(yè)內(nèi)容創(chuàng)作者創(chuàng)造更復(fù)雜、更詳細(xì)、更準(zhǔn)確、更自洽的內(nèi)容!绷值狼f表示。
消除準(zhǔn)確性和偏差
對(duì)幻覺、準(zhǔn)確性和偏見的擔(dān)憂也減緩了生成式人工智能模型的采用。當(dāng)模型在有偏見的數(shù)據(jù)上進(jìn)行訓(xùn)練時(shí),偏見可能會(huì)悄然出現(xiàn)。一些圖像生成模型可能會(huì)表現(xiàn)出對(duì)某一種族的人的偏好。
林道莊還表示,“模型開發(fā)者需要關(guān)注如何消除人工智能在消費(fèi)者數(shù)據(jù)訓(xùn)練過程中產(chǎn)生的偏見和道德問題,引導(dǎo)用戶走向更普遍、更持久的價(jià)值觀,引導(dǎo)模型變得更加‘善良’,這很重要!
改進(jìn)的上下文窗口
模型面臨的一個(gè)限制是它們?cè)谔崾局幸淮慰梢蕴幚淼男畔⒘。這稱為上下文窗口或上下文大小。例如,想象一下,您需要輸入一個(gè)非常長的提示(或描述)來嘗試生成圖像。在某些時(shí)候,生成式 AI 模型將無法處理整個(gè)提示。輸出將僅反映提示的一部分,從而忽略潛在的重要信息。
在另一個(gè)場景中,你可能需要與模型討論一個(gè)較長的文檔。隨著對(duì)話的進(jìn)行,模型可能會(huì)忘記對(duì)話的早期部分。
改進(jìn)上下文窗口將允許生成式人工智能模型處理更復(fù)雜的任務(wù),并提高其響應(yīng)的連貫性。
IEEE 研究生成員Hector Azpurua表示:“生成式人工智能所能做的事情尚未達(dá)到極限;我們還沒有達(dá)到這項(xiàng)技術(shù)的頂峰。”