首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數據|物聯(lián)網|量子|元宇宙|博客|特約記者
手機|互聯(lián)網|IT|5G|光通信|人工智能|云計算|芯片報告|智慧城市|移動互聯(lián)網|會展
首頁 >> 人工智能 >> 正文

ChatGPT 更聰明了!OpenAI 推出 GPT-4 大型語言模型:在諸多測試中表現(xiàn)比人類都好

2023年3月15日 09:29  IT之家  作 者:問舟

Open-AI 剛剛公布了其大型語言模型的最新版本 ——GPT-4(API 候補申請點此)。

GPT-4 可以更準確地解決你的難題,多模態(tài)的 GPT-4 還可以生成、編輯具有創(chuàng)意性或技術性的文章,在高級推理方面的表現(xiàn)超過其前輩(當前公開版 ChatGPT 基于 GPT-3.5)。當然,正如大家所猜測的那樣,微軟 New Bing 的聊天功能確實基于 GPT-4。

此外,該公司正在與合作伙伴 Be My Eyes 一起測試 GPT-4 的圖像輸入能力(注:Be My Eyes 是一款即將推出的智能手機 App,可以識別場景并對其進行描述,類似于大家常見的 AI 識圖的加強版)。

除了介紹網站,OpenAI 還提供了描述 GPT-4 功能的技術性論文,以及詳細描述其局限性的系統(tǒng)模型 Card。

OpenAI 計劃通過 ChatGPT 及其商業(yè) API 為用戶提供 GPT-4 的文本功能支持,但目前還需要等待。IT之家這里需要提醒一下,GPT4 目前僅 ChatGPT plus 賬號可用,可選 GPT4 模式進行對話,每 4 小時限制發(fā)送 100 條消息。

收費方面,大約 750 個單詞的提示收取約 3 美分的費用,約 750 個單詞的響應則收取 6 美分(就是問和答的區(qū)別)。

據介紹,GPT-4 比以前的版本“更大”,這意味著它已經借助比前輩更多的數據進行了訓練,并且在模型文件中有更多的權重,從而使得它的運行成本更高。

就任務而言,GPT-4 的表現(xiàn)比前輩更好,它可以遵循自然語言的復雜指令并生成技術或創(chuàng)意內容,而且它可以還更深入地做到這一點:它支持生成和處理多達 32768 個標記(約 25000 個文本單詞),從而實現(xiàn)比前輩更長的內容創(chuàng)建或文本分析。

OpenAI 表示,GPT-4 錯誤答案更少,而且也會減少偏離話題的可能,也盡可能不會再談論禁忌話題,甚至在許多標準化測試中比人類表現(xiàn)得都要更好一些。

例如,GPT-4 在模擬律師考試的成績在考生中排名前 10% 左右,在 SAT 閱讀考試中排名前 7% 左右,在 SAT 數學考試中排名前 11% 左右。相比之下,GPT-3.5 在律師考試中的得分一般都是倒數 10% 左右。當然,它們考個研究生還是沒問題的。

當然,AI 畢竟是 AI,OpenAI 也表示目前 GPT-4 并不完美,它在很多場景下的能力都不如人類。

據稱,該模型仍然存在“幻覺”或編造事實的問題,并且在事實方面也不一定總是可靠的,“它傾向于堅持認為它是正確的,即使它錯了”。OpenAI 表示,GPT-4 正在努力解決其局限性,例如社會偏見、幻覺和對抗性提示。

編 輯:章芳
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構成任何投資及應用建議。如網站內容涉及作品版權和其它問題,請在30日內與本網聯(lián)系,我們將在第一時間刪除內容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
工信部張云明:大部分國家新劃分了中頻段6G頻譜資源
精彩專題
專題丨“汛”速出動 共筑信息保障堤壩
2023MWC上海世界移動通信大會
中國5G商用四周年
2023年中國國際信息通信展覽會
CCTIME推薦
關于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網 CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業(yè)務經營許可證080234號 京公網安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經書面許可,禁止轉載、摘編、復制、鏡像