日活逆势大涨的百度翻译有什么魔力?
百度翻译日活迎来新一轮逆势增长:2020年Q1日活较上一季度环比增长10%,较去年Q1同比增长40%,这还是在在业内大盘增长整体放缓的前提下。
百度翻译日活迎来新一轮逆势增长:2020年Q1日活较上一季度环比增长10%,较去年Q1同比增长40%,这还是在在业内大盘增长整体放缓的前提下。
同时,百度翻译目前可支持语种扩充到200个,翻译方向近4万个,每天来自世界各地的翻译请求字符量超过千亿,相当于2000部大英百科全书,平均每秒钟就要翻译超过1百万字符。
百度翻译日活的增长,我们或可将归结为疫情的推动。
一方面是学生们在家学习、在线学习,有了更多时间通过手机和电脑使用百度翻译(在校学习期间K12学生不能使用手机);另一方面,疫情背景下,跨过的多语言沟通变得更加重要,跨语言的信息分享变得紧迫,百度翻译正好满足了突然集中爆发的市场需求。
当然,这并不是百度布局翻译方向十年以来能持续保持增长的全部,在翻译之外,百度翻译还藏着更多“秘密”。
好的翻译产品,从来不只是“翻得准确”
在过去很长一段时间内,“准确率”是评判一款翻译产品是否优秀的唯一标准,因而所有的翻译产品都在准确率上“做文章”,从各个维度的“成绩”来说明自己在这方面有多厉害,但事实上,随着越来越多AI技术融入到翻译产品,其体验好坏的评判维度变得多元起来。
首先,在翻译的广度和速度方面,要不断扩充与突破。
前者不应只局限在主流语言的互通上,而应寻求更大范围内的多语言互译,做到真正意义上的“与世界对话”;后者的最高境界是同声传译。
道理大家都懂,但做起来才知道为什么这两项能力不是每家都有,其原因就在于太难了。
翻译广度牵涉到小语种语言的训练资源,全球5000多种语言,有一半的语言使用者不到万人,很大一部分小语种语言的训练数据只有几万条甚至几千条,难以迈过翻译的门槛。
翻译速度牵涉到时间延迟和翻译质量难以平衡的难题,导致很多翻译产品的同声传译体验很难尽人所意。
百度翻译通过模型上的创新,比如在多语言翻译技术上,提出基于多任务学习的翻译模型、多智能体联合学习模型等,使多个语言可以共享模型表示,再经过回译技术进行数据增强,使得1个季度之内,翻译语种扩充了近7倍,目前支持200种语言互译,是全球支持语种数量最多的翻译系统。
在同声传译领域上,百度翻译又相继提出了可控时延的翻译模型、语义单元驱动的上下文感知翻译模型等,在技术获得了突破,不但开放了全球首个面向真实场景的中英文同传数据集,还举办了首届同传评测,促进本领域技术发展。
还有一个值得一说的案例,由前沿科技领域顶级科学家参与的iCANX Talks(全球前沿科技直播)主办方之前尝试了多款翻译产品,对翻译效果都不甚满意,直到近期才更换为百度翻译。
其次,翻译产品的使用场景不应只局限在原始的文本或语音输入场景中,还应更加丰富和多元。
在技术不断强化的今天,用户追求的产品体验变得更加全面和多样,如果只有“结果”而没有细节丰满的过程,哪怕有100%的准确率,也因为一个字一个字地输入而产生干涩的使用感受,市场不会买账,用户也不会买单。
百度翻译除了文本和语音这两种常规的输入翻译功能之外,其PC文档翻译功能支持word、pdf、ppt、excel等多种格式,支持中英、中日、中韩互译,一键上传,实现不限字数快速翻译,保留文档样式排版,原文译文对照查看,并支持免费导出,提升文档翻译效率。
视频翻译领域,百度翻译携手人人译视界联合推出了百度视频翻译平台,只需上传视频文件并填写必要信息,即可一站式获取AI和人工视频翻译结果。
除此之外,百度翻译在拍照翻译、实景AR翻译、对话翻译等场景中通过AI技术的融合持续在对体验细节进行改善。
可以预料的是,来源于百度的AI技术基底,百度翻译在帮助用户更好地完成翻译这件事上,未来或将增加更多创新性的技术体验。
最后,要从“语言转换”的狭隘产品认知中跳出。