近日,2023中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)(以下簡(jiǎn)稱“數(shù)博會(huì)”)在貴陽(yáng)舉行。本屆數(shù)博會(huì)以“數(shù)實(shí)相融算啟未來(lái)”為主題,加快促進(jìn)數(shù)字經(jīng)濟(jì)和實(shí)體經(jīng)濟(jì)有機(jī)融合,體現(xiàn)了算力作為數(shù)字經(jīng)濟(jì)核心生產(chǎn)力的重要性。
中國(guó)電信大數(shù)據(jù)和AI中心/數(shù)字智能科技分公司(以下簡(jiǎn)稱“電信智科”)積極參與本屆數(shù)博會(huì),圍繞數(shù)博會(huì)主題與中國(guó)電信貴州公司聯(lián)合打造超寫(xiě)實(shí)自研數(shù)字人IP“數(shù)數(shù)”。本屆數(shù)博會(huì)上,“數(shù)數(shù)”一出場(chǎng)便成為全場(chǎng)的焦點(diǎn),她主持了開(kāi)幕式及論壇發(fā)布會(huì),憑借生動(dòng)鮮明的人物形象和專業(yè)主持表現(xiàn)圈粉無(wú)數(shù)。
(相關(guān)資料圖)
數(shù)字人成功主持?jǐn)?shù)博會(huì)
初入會(huì)場(chǎng),來(lái)賓就能感受到“數(shù)數(shù)”的人格魅力。她面帶微笑,聲音清脆,熱情洋溢地歡迎廣大觀眾前來(lái)參會(huì);她的面部表情豐富多樣,能夠根據(jù)不同場(chǎng)合隨意調(diào)整;她動(dòng)作協(xié)調(diào),情緒飽滿,神態(tài)自然。同時(shí),“數(shù)數(shù)”還有海量知識(shí)儲(chǔ)備,兼具年輕活力與時(shí)尚新穎的現(xiàn)代科技感,可與參展觀眾交流、靈活互動(dòng)。
“數(shù)數(shù)”的形象打造和服裝設(shè)計(jì)由電信智科與貴州電信共同完成。在形象打造方面,以年輕女性為原型,擁有朝氣蓬勃的精神面貌。在服裝選擇方面,電信智科為“數(shù)數(shù)”設(shè)計(jì)了職業(yè)正裝風(fēng)格和科技風(fēng)格兩套服飾,均體現(xiàn)具有苗族特色的苗繡元素,為“數(shù)數(shù)”的形象呈現(xiàn)植入了地域特色與文化內(nèi)涵,實(shí)現(xiàn)科技與文化的有機(jī)融合。
在開(kāi)幕式環(huán)節(jié),“數(shù)數(shù)”與康輝配合主持整場(chǎng)開(kāi)幕式,博得臺(tái)下觀眾的熱烈掌聲。雖是剛出道的數(shù)字主持人,但她擁有的知識(shí)儲(chǔ)備、應(yīng)變能力以及良好的語(yǔ)言素養(yǎng),已達(dá)到優(yōu)秀主持人的水平,同時(shí)兼?zhèn)渲杏⑽幕プg、手語(yǔ)翻譯、眼神及微表情識(shí)別等多種技能。二人搭檔配合默契,尤其在主持互動(dòng)競(jìng)猜嘉賓環(huán)節(jié),康輝僅提示“超算”和“圖靈獎(jiǎng)”兩個(gè)關(guān)鍵詞,“數(shù)數(shù)”便能快速猜到嘉賓的名字是“杰克·唐加拉”,并對(duì)嘉賓展開(kāi)詳細(xì)介紹。
“數(shù)數(shù)”不僅是本屆數(shù)博會(huì)的主持人,還是數(shù)博會(huì)展廳一體機(jī)上的智能客服,在數(shù)字人一體機(jī)上能夠被語(yǔ)音喚醒,還能根據(jù)關(guān)鍵字及浮動(dòng)彈窗為用戶提供會(huì)務(wù)指引和地點(diǎn)指引,具備一定級(jí)別的開(kāi)放性交流問(wèn)答能力。
加強(qiáng)核心技術(shù)自主研發(fā)
數(shù)字人IP“數(shù)數(shù)”在本屆數(shù)博會(huì)上的精彩亮相,展示了電信智科在AI數(shù)字人領(lǐng)域的科研創(chuàng)新能力。電信智科自研數(shù)字人系統(tǒng)已完成數(shù)字人全鏈路能力構(gòu)建,打造電信特色數(shù)字人產(chǎn)品矩陣。其中,系統(tǒng)架構(gòu)包括生產(chǎn)底座、應(yīng)用平臺(tái)和場(chǎng)景服務(wù)三層,而驅(qū)動(dòng)中樞、多模交互、形象工廠是核心自研技術(shù)底座。
目前,電信智科使用了業(yè)界最先進(jìn)的4D LightStage采集技術(shù)掃描原始數(shù)據(jù),通過(guò)自定義的超寫(xiě)實(shí)級(jí)虛擬人數(shù)字標(biāo)準(zhǔn),將繁復(fù)的點(diǎn)云數(shù)據(jù)精簡(jiǎn)到一個(gè)約5萬(wàn)面的臉部模型網(wǎng)格,可復(fù)原人物面部的毛孔、汗毛、細(xì)紋等皮膚質(zhì)感細(xì)節(jié)。同時(shí)自研了一套“骨骼﹢BS”混合驅(qū)動(dòng)方式,可實(shí)現(xiàn)微表情級(jí)的數(shù)字人面部表達(dá),且支持標(biāo)準(zhǔn)化快速傳遞,能迅速綁定給新形象。
在算法層面,基于隱式學(xué)習(xí)及多模態(tài)特征融合的自研數(shù)字人驅(qū)動(dòng)引擎,可實(shí)時(shí)捕捉演員表情上每一個(gè)細(xì)微變化,對(duì)角色在講話時(shí)的口型進(jìn)行實(shí)時(shí)跟蹤,并將所有數(shù)據(jù)實(shí)時(shí)傳遞給渲染引擎。支持復(fù)雜表情/微表情的解算,可以自適應(yīng)適配多種骨骼綁定,支持多平臺(tái)下實(shí)時(shí)驅(qū)動(dòng)100萬(wàn)面以內(nèi)的3D模型。在電信智科自研超寫(xiě)實(shí)數(shù)字資產(chǎn)及驅(qū)動(dòng)引擎的加持下,一天內(nèi)就可快速生產(chǎn)出影視級(jí)數(shù)字人交互短片。
在本次數(shù)字人視頻制作中,電信智科基于該數(shù)字資產(chǎn)專門(mén)開(kāi)發(fā)了超寫(xiě)實(shí)風(fēng)格的相關(guān)渲染環(huán)境?;诖伪砻嫔⑸湫Ч恼鎸?shí)皮膚效果,光線可以順利對(duì)皮膚進(jìn)行透射,而不會(huì)完全阻擋,模擬真實(shí)皮膚的光照細(xì)節(jié)。除身份型數(shù)字人“數(shù)數(shù)”之外,電信智科的產(chǎn)品矩陣中還包括服務(wù)型數(shù)字人客服,已在北京、浙江、安徽、廣東等地的電信客服系統(tǒng)加載落地。
發(fā)力數(shù)字人業(yè)務(wù),搶灘元宇宙賽道。電信智科緊緊跟隨行業(yè)發(fā)展風(fēng)向,積極布局新技術(shù),未來(lái)將持續(xù)加大在數(shù)字人技術(shù)研發(fā)和應(yīng)用方面的投入,打造更加智能、靈活、逼真的數(shù)字人產(chǎn)品及能力,繪制AI數(shù)字人產(chǎn)業(yè)生態(tài)新圖譜。
關(guān)鍵詞: