在近日舉辦的第七屆數字中國建設峰會上,中國電信人工智能研究院宣布了一項技術突破,發(fā)布了業(yè)內首個能同時識別30種方言的語音識別大模型——星辰超多方言語音識別大模型。這一創(chuàng)新技術打破了傳統單一模型僅能識別特定方言的限制,為語言文化的傳承注入了新的活力。
中國是一個語言多樣性極其豐富的國家,“百里不同俗,十里不同音”的現象十分普遍。方言作為地域文化的重要組成部分,其保護和傳承顯得尤為重要。然而,由于方言種類繁多,語法語音特征各異,傳統的方言研究方式依賴大量的人力進行主觀感知和標注,工作量大且標注難以系統化。在此背景下,AI技術的介入無疑為方言的保護和研究帶來變革。
星辰超多方言語音識別大模型的發(fā)布,正是基于AI技術的高效與系統性對方言進行整理歸納的重大成果。該模型不僅能同時識別包括粵語、上海話、四川話、溫州話等在內的30多種方言,更在豐富性和質量上居于行業(yè)前列。這得益于中國電信人工智能研究院構建的超過30種、總計超過30萬小時的高質量方言數據庫。
在技術研發(fā)方面,中國電信的研發(fā)團隊首創(chuàng)了“蒸餾+膨脹”聯合訓練算法,有效解決了在超大規(guī)模多場景數據集和大規(guī)模參數條件下預訓練可能出現的坍縮問題。
目前,星辰語音大模型已在福建、江西、廣西、北京、內蒙古等地的中國電信10000智能客服進行試點應用。通過接入星辰大模型,智能客服能夠迅速理解30種方言,日均處理電話量達到約200萬通,極大地提高了服務效率和用戶體驗。此外,該模型還在多個城市的12345市民服務平臺得到應用,為市民提供更加便捷的服務。
星辰超多方言語音識別大模型的發(fā)布和應用,不僅展示了AI技術在語言文化傳承方面的巨大潛力,也為中國電信在人工智能領域的研究和應用增添了新的亮點。