近日,火山引擎正式發(fā)布“豆包.語音模型創(chuàng)業(yè)者加速計劃”,面向初創(chuàng)企業(yè)提供語音合成、聲音復刻和語音識別等大模型資源支持,入選企業(yè)可獲得3個月免費試用、價值4.7萬元的語音大模型服務。該計劃希望通過開放豆包語音大模型能力,加速AI語音相關新產品研發(fā),助力人工智能初創(chuàng)生態(tài)更加繁榮。目前火山引擎官網已開啟企業(yè)認證申請入口。
3大語音模型能力,數千小時及千萬字支持
該計劃針對人數少于30人,以及將AI語音能力融入新產品研發(fā)并長期迭代的初創(chuàng)企業(yè)。具體而言,火山引擎通過API調用等方式開放豆包.聲音復刻模型、豆包.語音合成模型、豆包.語音識別模型等熱門能力,共計數千小時及千萬字支持。企業(yè)可登錄火山引擎官網申請,通過企業(yè)認證之后填寫申請表,工作人員將在10個工作日進行審核,并對審核通過的企業(yè)發(fā)放支持資源代金券。獲得代金券后3個月內,初創(chuàng)企業(yè)可通過火山引擎官網控制臺及接口文檔接入豆包語音大模型能力,兌換免費額度,用于AI語音相關應用或產品的研發(fā)。
AI語音場景加速,助力良性生態(tài)發(fā)展
調研顯示,在發(fā)展“人工智能+”的大背景下,出于技術門檻和資金投入等因素,中小初創(chuàng)企業(yè)亟需更加廣泛深入的基礎設施和平臺支撐。
豆包語音大模型致力于多個語音場景的深耕,聚焦陪伴式AI交互、沉浸式聽書、跨語種內容生產、企業(yè)客戶服務等場景,為企業(yè)級客戶提供豐富的語音能力:
豆包.語音合成模型:根據上下文智能預測文本的情緒、語調等信息,并生成超自然、高保真、個性化的語音,以滿足不同用戶的個性化需求。
豆包.聲音復刻模型:全新自研語音大模型算法打造的高效化的輕量級音色定制方案。僅需只需5秒數據,即可完成對用戶音色、說話風格、口音和聲學環(huán)境音的復刻,并進行跨語種遷移。
豆包.語音識別模型:擁有更加靈敏的耳朵+更加聰明的大腦,通過上下文感知功能進行推理,識別效果更加精準,同時支持上海話、閩南語等多種方言識別。
目前,火山引擎豆包語音大模型能力已在豆包APP、剪映、抖音、番茄小說等多款內部產品展開應用,并逐漸向企業(yè)開放以拓展更多AI語音應用場景。大模型技術不斷演進成熟,推動人工智能向產業(yè)滲透,而初創(chuàng)企業(yè)正是應用創(chuàng)新的重要前線;鹕揭鎸⒊掷m(xù)推動字節(jié)跳動AI能力外溢,以成熟的大模型和平臺工具,以及廣泛的生態(tài)支持,助力廣大初創(chuàng)企業(yè)成長,實現人工智能時代的共同繁榮。