中新網(wǎng)5月25日電 最近,各信息平臺(tái)出現(xiàn)的新華社新聞播報(bào)引來(lái)大家關(guān)注,原因就是一些新聞不是真人播報(bào),而是運(yùn)用AI和3D技術(shù)打造的虛擬數(shù)字人主播播報(bào)。直觀來(lái)看,單從聲音很難分辨出是真人還是虛擬人物,如果不是標(biāo)題標(biāo)注“AI主播”字樣,大家很難分辨出這是AI的虛擬人物主播在播報(bào)新聞。這就是搜狗聯(lián)合新華社推出的3D AI合成主播“新小微”。
搜狗3D AI合成主播采用領(lǐng)先的掃描還原算法,以及面部肌肉驅(qū)動(dòng)、表情肢體捕捉等超寫(xiě)實(shí)3D數(shù)字技術(shù),生成高度還原真人發(fā)膚的形象逼真的數(shù)字人物模型,,在搜狗分身AI算法的驅(qū)動(dòng)下,只需輸入文本內(nèi)容,這個(gè)數(shù)字人模型就能根據(jù)語(yǔ)義實(shí)時(shí)播報(bào)新聞。重要的是,AI虛擬人物主播的表情唇動(dòng)、肢體動(dòng)作和語(yǔ)音表達(dá)高度契合,自然逼真度接近真人。
據(jù)了解,搜狗的AI主要沿著兩條線發(fā)展,一個(gè)是自然交互,一個(gè)是知識(shí)計(jì)算。核心是語(yǔ)言AI。通過(guò)人和機(jī)器之間進(jìn)行非常自然的交互設(shè)計(jì),從而達(dá)到自然逼真的效果,這其中也使用視覺(jué)和聽(tīng)覺(jué)的能力。;在知識(shí)計(jì)算上有三部分能力:對(duì)話、問(wèn)答、翻譯。而目前的AI合成主播涉及到搜狗整個(gè)AI技術(shù)鏈條上的核心技術(shù)。
搜狗AI交互技術(shù)部總理陳偉近日接受媒體采訪介紹到, 聯(lián)合新華社打造的3D AI合成主播項(xiàng)目研發(fā)周期有半年左右,其中包括數(shù)字人物建模、動(dòng)作采集。 畢竟現(xiàn)在數(shù)字人本身的技術(shù)不是很成熟,搜狗AI希望能更快速地構(gòu)建一個(gè)好的3D建模能力和數(shù)據(jù)能力,更重要的是打通3D技術(shù)和AI技術(shù)。
事實(shí)上虛擬人賽道上不少頭部企業(yè)都有涉獵,對(duì)于較早入局的搜狗也有自己的看法,陳偉認(rèn)為,真正的AI有外在的AI也有內(nèi)在的AI。外在的AI就像“搜狗分身”具備逼真或者高逼真的形象。
他還指出,現(xiàn)在的語(yǔ)音助手、電視、音像等用戶的一個(gè)助手,按照擬人化的方式來(lái)溝通,大部分公司還停留在做一個(gè)語(yǔ)言助手或者做一個(gè)有對(duì)話能力的機(jī)器人。但陳偉認(rèn)為人機(jī)交互應(yīng)該是內(nèi)外兼修的,外在的擬人化和內(nèi)在的擬人化都應(yīng)該具備,從現(xiàn)在來(lái)說(shuō),搜狗是走在了行業(yè)前端。
對(duì)于未來(lái),陳偉表示,接下來(lái)搜狗AI主路線是讓一個(gè)具備表達(dá)能力的虛擬人物具備交互能力,這是搜狗分身發(fā)展的主路線。未來(lái)搜狗將會(huì)在整個(gè)3D AI合成人物技術(shù)下不斷地打磨,結(jié)合更多的場(chǎng)景做出更自然的表現(xiàn)。例如,不久的將來(lái),AI主播可以到外景去做交互式采訪。
據(jù)悉,搜狗AI主播的商業(yè)化最早落地的是媒體領(lǐng)域和廣電領(lǐng)域,陳偉認(rèn)為媒體領(lǐng)域主播這種類型有一個(gè)成熟的流程,即采、編、播、管和存的先后順序,使得它可以從新聞素材的采集到制作到播放,使用AI合成來(lái)順利完成一個(gè)流程化的工作,解放繁瑣重復(fù)的人工工作。目前搜狗和一些電視臺(tái)或媒體的渠道商在合作,把AI主播集成到客戶的系統(tǒng)。
其次,在金融行業(yè),搜狗已經(jīng)做出第一個(gè)在金融領(lǐng)域落地的AI面審客服:去年在平安普惠APP上線了第一個(gè)AI面審客服,把具有交互式AI客服嵌入到平安普惠服務(wù)中,現(xiàn)在用戶使用平安普惠APP的貸款,可能就是搜狗AI客服在對(duì)接。陳偉表示,這項(xiàng)服務(wù)已經(jīng)在平安普惠的客服里面大規(guī)模使用了?;谶@樣的能力,未來(lái)也會(huì)帶動(dòng)搜狗在金融領(lǐng)域里快速普及。
陳偉坦言,未來(lái)3D AI虛擬人物在更多領(lǐng)域具備發(fā)展空間,因?yàn)樗撵`活性和可控性,使得搜狗可以在更多場(chǎng)景下做很多事情,例如,醫(yī)療健康、教育、金融和泛娛樂(lè)行業(yè),面向大眾的行業(yè)都可以使用。
曾經(jīng)有人擔(dān)心,AI會(huì)減少社會(huì)工作崗位,但陳偉不這么認(rèn)為,他指出,AI是要解決密集型勞動(dòng)和重復(fù)性勞動(dòng)的職業(yè)痛點(diǎn)。AI真正給社會(huì)帶來(lái)價(jià)值是降本增效,把人力成本降下來(lái),讓工作效率提升,例如目前客服、媒體等行業(yè)。
陳偉還認(rèn)為,AI虛擬人物技術(shù)正在逐漸取代部分人工工作,目的是到最后真正完全替代人工。把人從重復(fù)性工作解放出來(lái),做更有創(chuàng)新性的工作,這是AI技術(shù)未來(lái)發(fā)展所思考的。
陳偉表示:“目前AI主播以室內(nèi)播報(bào)為主,外景方面也會(huì)很快上線,兩會(huì)期間搜狗優(yōu)先保證給新華社搭建一套線上完整的虛擬演播廳,在虛擬演播廳下會(huì)支持他的站姿、坐姿播報(bào),同時(shí)引入了動(dòng)作、表情、有表現(xiàn)力的一些場(chǎng)景,使得從前到后的制作流程高效化,新聞稿件輸入進(jìn)去立刻生成一個(gè)制作精良的3D AI合成主播播送的新聞。”(完)