在層出不窮的AI硬件爆發(fā)的當(dāng)下,智能教育硬件市場(chǎng)也迎來新的機(jī)遇,經(jīng)歷了一系列從功能創(chuàng)新、內(nèi)容更新到用戶需求挖掘的變革。
隨著市場(chǎng)加速“內(nèi)卷”,大而全的學(xué)習(xí)機(jī)、復(fù)讀機(jī)類產(chǎn)品越來越多,市場(chǎng)規(guī)模增速趨緩的同時(shí),更多細(xì)分場(chǎng)景也在被逐漸發(fā)掘。從傳統(tǒng)的復(fù)讀機(jī),到AI時(shí)代的“聽力機(jī)”,有這樣一家企業(yè),探索出了一種新的品類,定義了一種新的需求,在青少年智能終端賽道,取得了“第一”的地位。 作為智能聽力機(jī)品類的開創(chuàng)者與領(lǐng)導(dǎo)品牌,聽力熊擁有豐富的產(chǎn)品線,包括智能聽力機(jī)、閱讀本和單詞寶等。
其中,新一代聽力機(jī)“聽力熊”T6,搭載了聽力熊自研的TeeniGPT——這是全球首款面向青少年的通用大模型應(yīng)用,該模型具備語音交互、語音生成和語義理解等功能,為青少年用戶帶來更有趣的智能體驗(yàn)。
僅兩年時(shí)間,聽力熊已經(jīng)成為了聽力機(jī)品類頭部企業(yè),打造出一個(gè)以AI技術(shù)為核心,線上線下全渠道覆蓋的新科技品牌。 目前,聽力熊的用戶累計(jì)已超100萬,且聽力熊的AI大模型應(yīng)用日均請(qǐng)求達(dá)100萬次,日均tokens消耗達(dá)10億,在青少年群體中廣受喜愛。
在聽力熊業(yè)務(wù)快速增長的過程中,阿里云為聽力熊提供了高性價(jià)比的算力與云服務(wù)解決方案,助其降低了運(yùn)營成本,并基于通義實(shí)驗(yàn)室智能語音交互產(chǎn)品和生成式語音大模型CosyVoice的能力,提供低延遲的語音互動(dòng)、個(gè)性化聲音的復(fù)刻以及生成豐富海量的有聲書,讓學(xué)生的熏聽更加有趣有料,這些技術(shù)提升了聽力熊的智能化水平和青少年用戶體驗(yàn),加速了其產(chǎn)品化進(jìn)程,推動(dòng)了面向青少年的專屬大模型迭代。
本期「看見新力量」欄目與聽力熊創(chuàng)始人兼CEO夏崇彥進(jìn)行對(duì)話,一起探討關(guān)于AI硬件在青少年教育上的創(chuàng)新和洞見。
01:挖掘教育硬件細(xì)分場(chǎng)景,開創(chuàng)“聽力機(jī)”智能化新物種
2021年,聽力熊創(chuàng)立之初,團(tuán)隊(duì)將其目標(biāo)定位為面向未來的、青少年專屬的便攜式AI終端,并以AI能力和創(chuàng)新的交互體驗(yàn)作為切入點(diǎn),推出了AI聽力機(jī)產(chǎn)品。2022年,聽力熊堅(jiān)持為青少年提供正版的優(yōu)質(zhì)內(nèi)容,與新東方、喜馬拉雅等內(nèi)容平臺(tái)展開合作,讓更多好內(nèi)容在產(chǎn)品中落地。2023年8月,聽力熊推出青少年通用大模型應(yīng)用“TeeniGPT”。在其助力下,聽力熊T6率先實(shí)現(xiàn)了中、英文雙語不同場(chǎng)景下的深度應(yīng)用。
談及對(duì)目標(biāo)用戶的洞察,夏崇彥講述創(chuàng)業(yè)過程中的一段摸索。2015-2017年,團(tuán)隊(duì)將多模態(tài)AI交互技術(shù)在全年齡段全場(chǎng)景進(jìn)行了測(cè)試。用戶數(shù)據(jù)結(jié)果顯示,青少年群體對(duì)于新技術(shù)以及新交互體驗(yàn)的包容性遠(yuǎn)遠(yuǎn)高于成年人:出于對(duì)效率的要求,成年人對(duì)尚不完善的AI技術(shù)的包容度很低,但對(duì)于青少年群體,一個(gè)足夠有趣的交互體驗(yàn)就能打動(dòng)他們,他們也對(duì)AI技術(shù)有著更大的好奇心。看到這個(gè)機(jī)遇的夏崇彥,立即展開了產(chǎn)品化的探索。
夏崇彥認(rèn)為,對(duì)于成長于技術(shù)爆發(fā)時(shí)期的“AI原生一代”,一款青少年專屬的大模型終端是不可或缺的。青少年群體如何利用其碎片化時(shí)間成為了夏崇彥團(tuán)隊(duì)的關(guān)注點(diǎn),他們從便攜性、安全健康的封閉生態(tài)需求出發(fā),為聽力熊的首款產(chǎn)品找到了最適宜的出發(fā)點(diǎn)——復(fù)讀機(jī),并利用AI技術(shù)和創(chuàng)新產(chǎn)品體驗(yàn)將其升級(jí)為“智能聽力機(jī)”。聽力機(jī)巧妙規(guī)避了傳統(tǒng)電子屏幕“傷眼”的弊端,操作簡單、易于攜帶,青少年用戶的反饋良好加上專業(yè)化的內(nèi)容體系,很快也取得了家長們的信任。
作為一款教育硬件產(chǎn)品,聽力機(jī)搭載的內(nèi)容質(zhì)量,是決定產(chǎn)品體驗(yàn)的重中之重。夏崇彥指出,傳統(tǒng)復(fù)讀機(jī)市場(chǎng)無法做到持續(xù)的破圈和高速增長,很大一部分原因是盜版內(nèi)容的泛濫。團(tuán)隊(duì)深知這無法撐起一個(gè)品牌長期發(fā)展的基礎(chǔ),于是在創(chuàng)業(yè)初期,就十分重視與優(yōu)質(zhì)內(nèi)容供給方的合作。除了喜馬拉雅、口袋故事等內(nèi)容平臺(tái),團(tuán)隊(duì)也將橄欖枝伸向了廣大出版機(jī)構(gòu)——不僅讓廣大用戶接觸到了高質(zhì)量的紙質(zhì)出版物,傳統(tǒng)出版機(jī)構(gòu)也可以以聽力熊為渠道,擴(kuò)大內(nèi)容的流量與覆蓋面,形成了雙贏的局面。
在智能化方面,公司高度重視對(duì)AI的應(yīng)用,基于和阿里云長期以來的合作基礎(chǔ)和信任,在對(duì)比了多家模型的效果后,聽力熊選擇了通義團(tuán)隊(duì)研發(fā)的技術(shù)產(chǎn)品,從語音識(shí)別、語音合成、LLM模型到語音翻譯,并將這些底層技術(shù)融入了產(chǎn)品的方方面面,持續(xù)改善用戶體驗(yàn),使產(chǎn)品使用更加流暢,也積累了大量的實(shí)踐成果。
得益于對(duì)用戶的使用理解和場(chǎng)景挖掘,聽力熊在市場(chǎng)上取得了積極的用戶反饋。在暑假期間,聽力機(jī)上線了一項(xiàng)AI角色互動(dòng)功能,雖然沒有進(jìn)行大范圍推廣,但在青少年用戶們自發(fā)的探索下,仍然實(shí)現(xiàn)了30%的首日打開率。在那一個(gè)月,聽力機(jī)的調(diào)用量激增40倍,日均調(diào)用量達(dá)10億tokens。截至目前,聽力熊的用戶規(guī)模已經(jīng)超過一百萬,青少年日均使用時(shí)長超3小時(shí),遠(yuǎn)超市面上的同類產(chǎn)品。
02:牽手通義智能語音,加速商業(yè)化與產(chǎn)品化進(jìn)程
過去幾年,由于電商領(lǐng)域的激烈競(jìng)爭(zhēng)與流量格局的變化,也給聽力熊銷售的穩(wěn)定性帶來了挑戰(zhàn),“雙減”政策的出臺(tái),更增添了外部環(huán)境的壓力。在復(fù)雜的市場(chǎng)環(huán)境下,聽力熊的商業(yè)化進(jìn)程依然在行業(yè)中“一馬當(dāng)先”。在這方面,夏崇彥也分享了團(tuán)隊(duì)的經(jīng)驗(yàn):“我覺得一個(gè)創(chuàng)業(yè)公司,我們需要追求商業(yè)化和技術(shù)的平衡成長。因?yàn)樵谖疫^去的創(chuàng)業(yè)過程中,往往單純追求技術(shù)領(lǐng)先。很多產(chǎn)品和功能其實(shí)不一定能獲得市場(chǎng)的認(rèn)可,商業(yè)化是一個(gè)必須要面對(duì)的現(xiàn)實(shí)的問題!
夏崇彥提出,團(tuán)隊(duì)在研發(fā)產(chǎn)品的初期,就聚焦于技術(shù)如何改善產(chǎn)品體驗(yàn),如何與用戶的需求場(chǎng)景相結(jié)合,這也是公司在商業(yè)化過程中考慮的重點(diǎn)。
AI大模型及云產(chǎn)品的技術(shù)能力與效率,關(guān)乎著聽力熊絕大多數(shù)的產(chǎn)品體驗(yàn)。早期,聽力熊通過購買英偉達(dá)A100算力卡,部署并微調(diào)開源模型的形式,實(shí)現(xiàn)對(duì)成本和效果的兼顧,但隨著用戶增長高頻使用帶來的成本增加,使得運(yùn)營難以持續(xù)。在公司產(chǎn)品接入阿里云后,阿里云為聽力熊提供了更高性價(jià)比的解決方案,特別是今年,阿里云多項(xiàng)云產(chǎn)品和AI產(chǎn)品及算力等成本大幅下降,使得團(tuán)隊(duì)的產(chǎn)品化進(jìn)程及效率進(jìn)一步加快。
此外,阿里云在云服務(wù)和AI領(lǐng)域具備強(qiáng)大的性能與豐富的經(jīng)驗(yàn),聽力熊的核心產(chǎn)品背后,包括在線音頻、云存儲(chǔ)與CDN等,均在阿里云進(jìn)行部署和運(yùn)營;而在模型能力方面,通義的語音語義識(shí)別、分析理解以及合成語音等場(chǎng)景下,均表現(xiàn)了出色的性能,實(shí)現(xiàn)了高水平的準(zhǔn)確度、擬人化與流暢度。
相較于傳統(tǒng)小模型的語音合成,通義CosyVoice大模型語音合成能夠根據(jù)它對(duì)上下文的理解,洞悉文本中隱含的情緒以及角色身份等信息,從而給出更有表現(xiàn)力和自然韻律的表達(dá)。在CosyVoice中,語義和韻律部分使用大模型進(jìn)行建模,并且在海量的多門語言、多樣情感數(shù)據(jù)上進(jìn)行訓(xùn)練,形成生成式語音大模型的基座,使得CosyVoice具備很強(qiáng)的遷移能力,即使原聲僅有1-3句話,也能復(fù)刻這個(gè)音色,這個(gè)易用好玩的功能在聽力熊上一經(jīng)上線,就受到了青少年用戶的熱情試用。
“阿里云是一家能夠給我們安全感的云服務(wù)廠家,不管是技術(shù)實(shí)力,還是產(chǎn)品穩(wěn)定性,還有服務(wù)響應(yīng)的及時(shí)性,都能很好的滿足公司經(jīng)營與發(fā)展的需求”,夏崇彥如此評(píng)價(jià)。在AI模型面向青少年群體的解決方案調(diào)優(yōu)過程中,為了符合這一人群的認(rèn)知能力和表達(dá)習(xí)慣,同時(shí)實(shí)現(xiàn)對(duì)不良內(nèi)容的過濾,聽力熊與通義技術(shù)團(tuán)隊(duì)展開了深度的交流和合作,共同開發(fā)適宜于青少年的大模型,在這個(gè)過程中,阿里云和通義團(tuán)隊(duì)為我們提供了非常好的解決方案與快速的響應(yīng)能力。
03:陪伴“一代人”成長,做好“一代人”的大模型終端
目前,聽力熊已在北京、深圳等城市設(shè)立公司業(yè)務(wù),未來公司也會(huì)計(jì)劃在杭州設(shè)立大模型應(yīng)用研發(fā)中心,圍繞AI大模型的應(yīng)用場(chǎng)景進(jìn)行智能終端的研發(fā),不斷提升用戶的產(chǎn)品體驗(yàn)與Agent的效能。
已經(jīng)擁有百萬用戶的聽力熊并不滿足于當(dāng)前的成就,而是將目光放在了更遠(yuǎn)的未來,基于AI技術(shù)不斷地進(jìn)步,致力于從學(xué)習(xí)到生活,從認(rèn)知到自我實(shí)現(xiàn),全方位地服務(wù)于青少年成長過程中的各類需求。
聽力熊創(chuàng)始人兼CEO夏崇彥認(rèn)為,在可以看得見的未來,AI終端的服務(wù)交付形式將發(fā)生變化,從“人找服務(wù)&設(shè)備”到“服務(wù)&設(shè)備找人”的轉(zhuǎn)變,從“理解用戶需求”到“提前解決用戶需求”,通過 AI + 終端應(yīng)用的創(chuàng)新模式,實(shí)現(xiàn)從基于用戶指令的傳統(tǒng)應(yīng)用到基于用戶潛在意圖主動(dòng)服務(wù)的根本性轉(zhuǎn)變,徹底重塑跨端體驗(yàn)。未來AI產(chǎn)品的服務(wù)會(huì)深入到用戶的需求和體驗(yàn),企業(yè)也需要為用戶持續(xù)提供更個(gè)性化的服務(wù),才可以更長久地獲得用戶的信任。
基于AI終端對(duì)青少年群體學(xué)習(xí)成長陪伴的長期主義理念,聽力熊致力于打造一代人的AI大模型終端設(shè)備,陪伴一代人的成長。通過提供長期的陪伴和個(gè)性化服務(wù),從教育學(xué)習(xí)場(chǎng)景逐步擴(kuò)展到更多元的領(lǐng)域,實(shí)現(xiàn)品牌與用戶的共同成長。
超級(jí)應(yīng)用的背后,離不開強(qiáng)大的技術(shù)支持,AI時(shí)代對(duì)基礎(chǔ)設(shè)施的性能、效率提出了更高的要求。2024云棲大會(huì)現(xiàn)場(chǎng)展示了阿里云全系列產(chǎn)品家族面向AI的升級(jí):最新上線的磐久AI服務(wù)器,并提供AI算法預(yù)測(cè)GPU故障,準(zhǔn)確率達(dá)92%;為AI設(shè)計(jì)的高性能網(wǎng)絡(luò)架構(gòu)HPN7.0,可穩(wěn)定連接超過10萬個(gè)GPU ,模型端到端訓(xùn)練性能提升10%以上;人工智能平臺(tái)PAI,已實(shí)現(xiàn)萬卡級(jí)別的訓(xùn)練推理一體化彈性調(diào)度,AI算力有效利用率超90%。在模型層,通義實(shí)驗(yàn)室也持續(xù)飽和式投入,幾乎保持以月為周期迭代基礎(chǔ)模型。云棲大會(huì)現(xiàn)場(chǎng)阿里云宣布通義旗艦?zāi)P蚎wen-Max全方位升級(jí),性能接近GPT-4o,同時(shí)還發(fā)布了開源模型Qwen2.5系列,成為僅次于美國Llama的世界級(jí)模型群。
同時(shí),據(jù)IDC發(fā)布《中國人工智能公有云服務(wù)市場(chǎng)份額2023:大模型重塑云服務(wù)》報(bào)告中,阿里云智能語音公有云服務(wù)市場(chǎng)份額35.6%,排名第一。這是繼2019年后,阿里語音AI市場(chǎng)份額連續(xù)五年保持首位。
“作為青少年用戶學(xué)習(xí)交互的入口,未來很期待能夠與阿里云、通義實(shí)驗(yàn)室更深入的合作,將AI技術(shù)與更廣泛的場(chǎng)景結(jié)合起來,更好地滿足青少年成長過程中的需求”,夏崇彥表示。
據(jù)測(cè)算,到2025年,我國的教育智能硬件市場(chǎng)規(guī)模將超過1000億元人民幣,廣闊的市場(chǎng)必將帶動(dòng)學(xué)習(xí)機(jī)企業(yè)進(jìn)行不斷地創(chuàng)新和迭代。同時(shí)伴隨著大模型推理及多模態(tài)能力的持續(xù)提升、端側(cè)AI的突破及算力成本的下降,將推動(dòng)AI+智能終端空間進(jìn)一步打開。聽力熊將會(huì)伴隨青少年在學(xué)習(xí)和成長的道路上,探索智能化的無限可能。