首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 移動互聯(lián)網(wǎng)舊 >> 正文

變身“奧運冠軍”特效刷爆全網(wǎng),背后是QQ影像中心人體姿態(tài)遷移技術(shù)

2021年8月9日 16:35  CCTIME飛象網(wǎng)  

在剛剛落幕的東京奧運會上,中國體育代表團(tuán)取得了38枚金牌、32枚銀牌、18枚銅牌的優(yōu)異成績。這屆奧運會期間,除了全民熱議運動健兒的精彩表現(xiàn)之外,還有一項神奇的變身特效活動——「我的奧運奪冠時刻」也在全網(wǎng)發(fā)酵,引得網(wǎng)民爭相試玩和轉(zhuǎn)發(fā)。

在手機(jī)QQ的相機(jī)功能中,或者天天P圖app中,只需上傳一張自己的半身照或是全身照,就可以一秒get奧運健兒的同款奪冠時刻,讓眾多網(wǎng)友大呼“神奇”,“玩得停不下來”。

在這個變身特效視頻的背后,是QQ影像中心研發(fā)的人體姿態(tài)遷移技術(shù)。人體姿態(tài)遷移技術(shù)簡單來說,就是給到機(jī)器一副含有人物的圖片和一個目標(biāo)姿態(tài),之后經(jīng)過計算將人物轉(zhuǎn)換為目標(biāo)姿態(tài)的狀態(tài)。

區(qū)別于人臉特效功能,圍繞人體的GAN生成落地難度較大。在人體動作遷移實現(xiàn)過程中,動作跨度大、像素搬移多、紋理復(fù)雜、動作自由度高和自遮擋頻繁等干擾因素導(dǎo)致生成指定姿態(tài)的人體一直比較困難。目前,主流的人體人體姿態(tài)遷移方案有2D warp、3D warp和不依賴warp的解決方案,這三種方式各有利弊,且并未真正落地于實際商業(yè)生產(chǎn)應(yīng)用。

三大技術(shù)突破,解鎖人體姿態(tài)遷移動效新體驗

針對現(xiàn)有方案的不足,并考慮在實際應(yīng)用中,多圖或視頻輸入的姿態(tài)遷移方法會使得用戶使用門檻很高,帶來不太好的用戶體驗。QQ影像中心團(tuán)隊采用基于單圖的3D人體重建結(jié)合GAN生成的技術(shù)路線。

首先,比起主流方式所需要的視頻+在線微調(diào)(finetune)模式,QQ影像中心的技術(shù)只需要單張用戶圖就可以完成姿態(tài)遷移,并且不需要在線進(jìn)行模型微調(diào)。如此,便能成功將用戶的交互難度大大降低。

針對難度極大的3D人體重建,雖然市面上有開源的3D mesh數(shù)據(jù)庫,比如加州伯克利分校的開源端到端框架HMR,但是效果并不理想。所以QQ影像中心團(tuán)隊為此專門研發(fā)了一套人體3D重建算法,讓整個效果更為流暢連貫。輸入單張用戶圖片,就能得到精確地人體形狀和紋理,繼而將動態(tài)變化的每一幀都轉(zhuǎn)化到參考幀上,再經(jīng)過計算制作成特效。

其次,是生成清晰度高,紋理還原度好,支持更高分辨率輸出(1024x1024)。比起原先2D warp、3D warp在逼真程度和清晰度上的短板,QQ影像中心算法能夠保證其生成質(zhì)量。其中利用人體分割和背景填充技術(shù),完成目標(biāo)視頻的背景修補(bǔ)。

而針對3D warp圖紋理信息粗糙的現(xiàn)象,則利用GAN網(wǎng)絡(luò)來細(xì)化(refine)用戶warp圖。具體做法是將用戶信息與warp圖信息在GAN網(wǎng)絡(luò)中融合,生成自然的目標(biāo)姿態(tài)用戶圖。在這一步中GAN網(wǎng)絡(luò)又分為兩個子網(wǎng)絡(luò),分別是重建網(wǎng)絡(luò)與姿態(tài)生成網(wǎng)絡(luò)。將用戶圖重建,之后生成網(wǎng)絡(luò)輸入粗粒度warp圖,之后接受重建網(wǎng)絡(luò)的特征圖并進(jìn)行特征融合,以保證細(xì)節(jié)信息的準(zhǔn)確性,之后特征圖將進(jìn)入解碼器,融合前景和特征圖,最后得到輸出圖。

最后,針對基于3D的技術(shù)方案容易遇到動作僵硬的問題,QQ影像中心通過平滑策略、2D點輔助優(yōu)化等策略,既保證了素材的動作準(zhǔn)確性,也使動作更加連貫自然。

其實,這次「我的奧運奪冠時刻」變身特效的爆款出圈并非首例。此前,手機(jī) QQ相機(jī)功能中內(nèi)嵌的熱門AI玩法——漫畫臉,迪士尼童話臉等,同樣出自QQ影像中心團(tuán)隊。

從人臉特效到人體動作遷移,QQ影像中心持續(xù)探索前沿 AI 和 CV 算法,致力于將前沿的 AI 能力、3D 渲染技術(shù)以及先進(jìn)的玩法賦能產(chǎn)品。團(tuán)隊在語義分割、目標(biāo)檢測、分類識別、GAN生成對抗等方面的深厚技術(shù)積累,在AI生成領(lǐng)域已進(jìn)行了很多相關(guān)算法的研發(fā)和落地工作。

值得期待的是,未來QQ影像中心也會帶來更多特效玩法落地,給用戶帶來更多有趣的科技體驗。

關(guān)于騰訊QQ影像中心

騰訊QQ影像中心(原騰訊光影研究室)是騰訊旗下專注于研究前沿影像處理技術(shù)的團(tuán)隊,在單目深度估計技術(shù)、語義分割、目標(biāo)檢測、分類識別、GAN生成對抗等方面均有深厚的技術(shù)積累。團(tuán)隊一直致力于探索泛娛樂綜合解決方案,將前沿的AI能力、先進(jìn)的玩法引擎和3D渲染技術(shù)賦能產(chǎn)品,讓視覺創(chuàng)意更多樣,音視頻編輯更智能,社交溝通更趣味。

編 輯:T01
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問題,請在30日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
工信部張云明:大部分國家新劃分了中頻段6G頻譜資源
精彩專題
專題丨“汛”速出動 共筑信息保障堤壩
2023MWC上海世界移動通信大會
中國5G商用四周年
2023年中國國際信息通信展覽會
CCTIME推薦
關(guān)于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像