AI虚拟主播“小灵”背后有哪些秘密?

资讯 5年前
646
AI虚拟主播“小灵”背后有哪些秘密?

今年“五四运动”迎来一百年的生日,在中央广播电视总台主题为“我们都是追梦人”的 2019《五月的鲜花》五四晚会上为其献上一份“新鲜”大礼,百度大脑AI虚拟主持人小灵首次亮相。作为“新新”青年的代表,小灵在舞台上赚足了眼球,既能通过人脸识别技术与嘉宾互动,又有极强地控场能力。

小灵作为3D立体虚拟主持人,糅合了百度大脑的语音、视觉、大数据,以及AR等多重技术,其中最引人注目的是“唇动技术”。小灵的唇动技术,基于大量的面部特征数据学习,辅之以人工智能和深度学习技术而形成的。小灵优秀的主持功力背后,究竟有哪些技术作为支撑呢?虚拟主持人将会有多大的发展前景呢?接下来我们细细剖析!

“小灵”台上一分钟,AI幕后做了哪些“十年功”?

小灵在从漫天飞舞的鲜花中走出来,站在主持人小尼和王俊凯中间热情地与观众互动,活动过程中能够发表自己的观点,看似简单的行为,背后少不了海量的数据支持和超强的人工智能技术运用。

首先,不得不提小灵的“唇动技术”。人说话嘴唇会自然而然地跟着运动,我们习以为常的事情对于AI虚拟主持人便没有那么简单了。小灵想要达到能够在说话的时候像人一样自如地开合嘴唇,她一定要做好充足的准备。第一项准备事宜便是面部数据的搜集,每一项人工智能技术的产生都需要大量的数据作为基石。基于对海量的面部数据进行深度学习加之语音合成技术,便形成了我们看到的人工智能虚拟主持人“小灵”在晚会上能够“真实唇动”。

其次,人脸识别技术更是现场最大的亮点。在与主持人小尼互动的时候,小尼想借用00后爱看的动画片来掩盖自己的真实年龄时,小灵并没有“上当”。小灵通过人脸识别技术采集了小尼的人脸信息,并利用知识图谱清楚地知道小尼的年龄。在小尼企图用《喜羊羊与灰太狼》来欺骗小灵时,小灵迅速运用自己的“超级大脑”知识图谱来反驳他说,《黑猫警长》、《葫芦兄弟》才真正属于他的年代。人脸识别+知识图谱的技术让小灵能够在现场做到随机应变,与此同时人脸识别技术还运用到了与嘉宾互动的环节。今年晚会上有一个有趣的测“花”活动,小灵通过人脸识别技术便可测出你是什么“花”。

除了人脸识别技术,还有AR、大数据、语音识别等技术运用在小灵身上。“台上一分钟,台下十年功”,小灵虽然第一次登台,却能够落落大方、对答如流离不开各类AI技术的成熟与灵活配合。

AI虚拟主持人究竟能走多远?

其实,小灵并不是首位AI人工智能主持人,在今年两会期间搜狗与新华社联合推出的“新小萌”和科大讯飞推出了“小晴”两位人工智能虚拟主持人。两会期间推出的两款均可以找到原型,如新华社推出的“新小萌”是以新华社主播曲萌为原型。这类虚拟主持人通常是真人输入语音,随后对声音进行标注和机器进行深度学习,以此构建出其发音声学模型,在此基础上,输入任何文本便可进行语音合成,进而实现在线播报。本次五四晚会亮相的“小灵”是以二次元形象示众,没有明确的原型可以寻觅。与此同时小灵需要在舞台上与其他主持人和嘉宾互动,和在线播报相比,小灵不仅要运用到语音识别的技术还要具备能够在短时间内进行大数据运算的能力。对于虚拟主持人来说,技术发展有了进一步的提升,但很多人依旧存在疑惑,虚拟主播要来抢“播音员”的饭碗吗?

人工智能作为一项通用技术,可以为了各行各业出现的问题提供解决办法,对于主持人行业来说也不例外。首先,虚拟主播可以节省大量人力成本。科大讯飞推出的“小晴”精通多种语言,可以在中文、日语、英语、韩语等多种语言中随意切换,并且发音准确,十分专业。如何能够将该项技术可以广泛普及,在对外宣传的节目中,专业、标准的发音能够极大地提高传播效果。此外,虚拟主播能够在恶劣的环境中完成播报。众所周知在各大事件发生时,记者总是要冲在第一线,掌握最新信息播报给大众,但优势环境过于恶劣或者人力难以到达的时候,虚拟主播或许能够派上用场。在战火纷飞的战场通过无人机获取最新情况后,虚拟主播可以实时播报新闻;地震、洪水等自然灾害发生后,记者难以最先达到事故发生区,虚拟主播便有了用武之地。

虚拟主播随着人工智能技术的不断发展,可以不断解决行业内存在的问题。至于虚拟主播究竟能不能取代人类的担忧,依旧是“杞人忧天”。人工智能技术是让人类可以从繁杂、无聊的工作中解脱出来,而不是取代人类,真正有创造性的工作依旧需要人类自己完成。

© 版权声明

相关文章