搜狗自主创新的AI多模态合成技术
搜狗分身技术推出至今不到一年时间,已在媒体融合、互联网法院、金融客服、会议会展等领域实现大规模应用,推动了多个领域的信息内容生产和传播的变革。
第六届世界互联网大会在乌镇隆重开幕,自设立之初便有未来科技发展“风向标”之称的“领先科技成果”依然是全网聚焦的重头戏。
该奖项不仅代表着全球互联网领域前沿的技术成果,同时引领着未来科技的发展方向。今年的“领先科技成果”涉及人工智能、5G、大数据、云计算等多个领域,除阿里、腾讯、华为、微软、特斯拉等知名企业的最新技术外,搜狗公司凭借分身技术也强势入选。
搜狗分身跻身“领先科技成果”:一年多次重大技术迭代
搜狗“分身”技术是搜狗自主创新的AI多模态合成技术,仅基于少量音视频数据,即可快速迁移生成AI分身模型,并展现出与真人相差无异的信息传达效果。
此次入选“领先科技成果”,并非是搜狗分身技术在世界互联网大会的首次亮相。2018年11月在世界互联网大会现场,搜狗联合新华社推出的全球首个“AI合成主播”邱小浩,背后就依赖于搜狗分身技术。
当时,“邱小浩”堪比真人的新闻播报能力震惊中外媒体,引起业内研发分身同类技术的一股热潮。能够引领技术潮流,源于搜狗对分身技术的持续升级迭代,以不断拓展产品能力,优化体验细节。
从推出仅能实现唇形和语音同步的初代“AI合成主播”至今,不到一年时间,搜狗AI团队不断优化图像引擎,设计表情动作库,实验多语种分身,短短时间成就了如今兼具姿态和情感表现能力,以及多种语言能力的第四代虚拟分身。
最新一代虚拟主播形神兼备的表现,表明了搜狗公司在这个领域的人工智能技术,在业内乃至全球范围内都已处于领先地位。
透视“领先科技成果”:多行业落地应用前景广阔
和业界同类技术相比,搜狗分身技术的领先优势主要体现在三个方面。首先,搜狗“分身”技术是业内首次使用真人形象的分身技术,现已有自有真人视频形象,也可进行指定真人形象建模,形象逼真,真实度高。
其次,搜狗“分身”技术可以确保声音与唇形完全匹配,达到惊人的同步性,这得益于搜狗“分身”技术在语音和动作建模方面的技术优势。
最后,搜狗“分身”技术可以达到实时输出合成内容,使用者通过文字键入、图像文字识别或语音输入等多种方式输入文本,即可以实时生成视频内容,极大减少内容制作的各方面成本。
当然,AI合成主播“邱小浩”去年首次亮相时的精彩播报表现,吸引的不仅仅是跟风此类技术投入研发的业内同行,同时也吸引了金融、法律、文娱等各个产业中对分身技术的应用充满想象的“领军型”企业。搜狗分身技术推出至今不到一年时间,已在媒体融合、互联网法院、金融客服、会议会展等领域实现大规模应用,推动了多个领域的信息内容生产和传播的变革。
在媒体融合领域,搜狗同新华社、央视合作推出的多个“AI合成主播”已经入职,参与了首届进博会、2019春运、315晚会等重要报道。在法律领域,搜狗联合北京互联网法院推出的“AI虚拟法官”已经在后者的「在线智慧诉讼服务中心」上线,7*24小时为用户提供着「智能导诉」服务,引导用户更流畅地使用网络诉讼平台,实现了用户全程在线操作的自主化。
新一轮科技革命前夜,搜狗助力社会智能化变革
AI、5G、大数据的发展与应用,让智能生活充满想象空间。
在本次世界互联网大会上,搜狗AI交互事业部总经理王砚峰也发表了自己的看法,他提出,“AI技术的大使命从来都是赋能人,而不是替代人。”搜狗不断研发AI技术,并探索创新落地的方式,就是为了协助人们更便捷、更智能的工作生活。
以搜狗分身技术为例,在与传媒、金融服务、互联网法院等各行各业融合协作的过程里,助推企业节约了信息内容生产成本,补充了专业人力资源的缺口,驱动了内容生产创新,同时也带来了公共服务质量的提升。相关从业者在得到赋能的同时,也最大程度地释放了他们的创造力。
相信未来在基础服务领域,搜狗分身技术可提供更多的智能服务形象,如“AI医生”、“AI教师”等,他们可以替代传统的语音答疑、文字答疑等方式,成为基础公共服务的重要补充形式,强化各级公共服务终端作用。