9月24日下午消息,字節(jié)跳動旗下火山引擎在深圳舉辦AI創(chuàng)新巡展,一舉發(fā)布了豆包視頻生成-PixelDance、豆包視頻生成-Seaweed兩款大模型,面向企業(yè)市場開啟邀測。
火山引擎總裁譚待表示,“視頻生成有很多難關(guān)亟待突破。豆包兩款模型會持續(xù)演進(jìn),在解決關(guān)鍵問題上探索更多可能性,加速拓展AI視頻的創(chuàng)作空間和應(yīng)用落地!
此外,豆包大模型不僅新增視頻生成模型,還發(fā)布了豆包音樂模型和同聲傳譯模型,已全面覆蓋語言、語音、圖像、視頻等全模態(tài),全方位滿足不同行業(yè)和領(lǐng)域的業(yè)務(wù)場景需求。
在產(chǎn)品能力日益完善的同時,豆包大模型的使用量也在極速增長。據(jù)火山引擎披露,截至9月,豆包語言模型的日均tokens使用量超過1.3萬億,相比5月首次發(fā)布時猛增十倍,多模態(tài)數(shù)據(jù)處理量也分別達(dá)到每天5000萬張圖片和85萬小時語音。
此前,豆包大模型公布低于行業(yè)99%的定價,引領(lǐng)國內(nèi)大模型開啟降價潮。譚待認(rèn)為,大模型價格已不再是阻礙創(chuàng)新的門檻,隨著企業(yè)大規(guī)模應(yīng)用,大模型支持更大的并發(fā)流量正在成為行業(yè)發(fā)展的關(guān)鍵因素。
據(jù)譚待介紹,業(yè)內(nèi)多家大模型目前最高僅支持300K甚至100K的TPM(每分鐘token數(shù)),難以承載企業(yè)生產(chǎn)環(huán)境流量。例如某科研機(jī)構(gòu)的文獻(xiàn)翻譯場景,TPM峰值為360K,某汽車智能座艙的TPM峰值為420K,某AI教育公司的TPM峰值更是達(dá)到630K。為此,豆包大模型默認(rèn)支持800K的初始TPM,遠(yuǎn)超行業(yè)平均水平,客戶還可根據(jù)需求靈活擴(kuò)容。
“在我們努力下,大模型的應(yīng)用成本已經(jīng)得到很好解決。大模型要從卷價格走向卷性能,卷更好的模型能力和服務(wù)。”譚待表示。