首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片報告|智慧城市|移動互聯(lián)網(wǎng)|會展

首頁 >> 人工智能 >> 正文

AI公司MosaicML推出70億參數(shù)模型MPT-7B-8，號稱“一次處理 8000 字長文本、可商用”

2023年7月26日 10:26 IT之家作者：漾仔

AI 創(chuàng)業(yè)公司 MosaicML 近日發(fā)布了其 70 億參數(shù)模型 MPT-7B-8K，據(jù)悉，該模型一次可以處理 8000 字文本，相當(dāng)擅長處理長文重點摘要和問答，還能在 MosaicML 平臺上根據(jù)特定任務(wù)，進一步微調(diào)相關(guān)配置。

據(jù)悉，系列模型采用了 150 萬個 Token，并以 256 塊 H100 GPU 花 3 天完成模型訓(xùn)練而成。MosaicML 本次發(fā)布了 3 個版本模型，包括 MPT-7B-8k、MPT-7B-8k-Instruct 和 MPT-7B-8k-Chat。

其中，第一個版本 MPT-7B-8k、是以 Transformer 解碼器為基礎(chǔ)，并以 FlashAttention 和 FasterTransformer 機制來加速訓(xùn)練與推論，能一次處理 8000 字文本，MosaicML 公司表示，該模型開源、允許商用。

第二個版本 MPT-7B-8k-Instruct 是以第一個版本 MPT-7B-8k 微調(diào)而成，MosaicML 公司表示，MPT-7B-8k-Instruct 模型可處理長篇指令，特別注重于生成“摘要和問答”，該模型一樣開源且可商用。

第三個版本 MPT-7B-8k-Chat 則是機器人對話式的 AI 模型，MosaicML 公司宣稱，該模型額外多用了 15 億個聊天數(shù)據(jù) Token，在第一版模型 MPT-7B-8k 之上繼續(xù)訓(xùn)練而成，該模型開源，但不允許商用。

據(jù)此前報道，MosaicML 公司也推出了一款號稱訓(xùn)練成本僅為競品零頭的 MPT-30B 開源模型，該公司日前已將所有開源模型發(fā)布于 Huggingface 平臺，感興趣的小伙伴們可以前往進行相關(guān)了解，還可以在本地硬件上使用自己的數(shù)據(jù)，在下載后，對模型進行各種微調(diào)。

編輯：章芳

聲明：刊載本文目的在于傳播更多行業(yè)信息，本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問題，請在30日內(nèi)與本網(wǎng)聯(lián)系，我們將在第一時間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777，郵件后綴為#cctime.com，冒充本站員工以任何其他聯(lián)系方式，進行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為，均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。

相關(guān)新聞

·提速云端，引領(lǐng)創(chuàng)新 SAP賦能新型中國企業(yè)把握三大發(fā)展趨勢	·中國廣電2024年度工作會議:全面實施“1368N”計劃
·電信運營商在生成式人工智能生態(tài)中的角色定位	·工信部：已推動超1.4億臺國產(chǎn)智能手機和智能電視適老化..
·機構(gòu)：2024年小芯片市場規(guī)模將達(dá)44億美元	·6G行業(yè)新標(biāo)準(zhǔn)再出優(yōu)選布局場景是發(fā)展關(guān)鍵
·機構(gòu)預(yù)測2024年5G智能手機市場：Top3格局不變，5G毫米..	·聯(lián)想高管：三年內(nèi)摩托羅拉成為全球TOP3手機廠商
·OPPO與諾基亞簽署5G專利交叉許可協(xié)議雙方將結(jié)束所有未..	·Canalys發(fā)布2024年全球科技行業(yè)十大趨勢：中國將成為全..
·賦能千行百業(yè) 工業(yè)互聯(lián)網(wǎng)讓數(shù)字化具象化	·我國蜂窩物聯(lián)網(wǎng)用戶已有23.32億戶占移動網(wǎng)終端連接數(shù)..
·2023年全國移動短信業(yè)務(wù)量下降0.3% 收入比上年下降0.7%	·全國移動互聯(lián)網(wǎng)用戶達(dá)15.17億戶 2023年全年凈增6316萬戶

人物

工信部張云明：大部分國家新劃分了中頻段6G頻譜資源

·信通院曹薊光：下一代網(wǎng)絡(luò)研究正..

·信通院張海懿：量子信息技術(shù)已進..

·信通院李文宇：醫(yī)療仍是腦機接口..

·信通院周蘭：元宇宙尚處于早期的..

·中國信通院孟楠：新型內(nèi)生安全技..

·栗蔚：算力互聯(lián)互通體系讓算力真..

精彩專題

專題丨“汛”速出動共筑信息保障堤壩

2023MWC上海世界移動通信大會

中國5G商用四周年

2023年中國國際信息通信展覽會

CCTIME推薦

·崔巍出席省青年企業(yè)家助力高質(zhì)量..

·2023中國企業(yè)信用500強發(fā)布中天..

·5G、AI等技術(shù)創(chuàng)新應(yīng)用力度加大數(shù)..

·FTTR進入規(guī)模發(fā)展加速期

·400G將在今年實現(xiàn)規(guī)模商用

·喜迎開門紅！中信科移動中標(biāo)中國..

·聚焦開源、合作共建：openGauss打..

·中天科技緊急馳援甘肅災(zāi)區(qū) 首批通..

·情暖隴原，共克時艱！亨通緊急馳..

·強基賦智 | 思特奇數(shù)據(jù)中臺數(shù)智化..

·重磅！亨通成為全球“燈塔工廠”

·中信科移動積極參加2023全球6G發(fā)..

·數(shù)據(jù)筑基加速產(chǎn)業(yè)升級——思特奇..

·亨通量子“江蘇省量子保密通信試..

·5G融合創(chuàng)新提檔升級構(gòu)筑產(chǎn)業(yè)新優(yōu)勢

關(guān)于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1 電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號京公網(wǎng)安備110105000771號
公司名稱：北京飛象互動文化傳媒有限公司
未經(jīng)書面許可，禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像