行业资讯

AI news by Smartone AI

高效实时语音合成:SqueezeWave

加州大学伯克利分校的研究人员提出了一种超轻量级的声码器模型SqueezeWave,相较于WaveGlow减小了61-214倍的计算量,在众多边缘设备上——甚至是树莓派上——都能有效部署实现高效的实时语音合成。

基于对抗路径采样的反事实视觉语言导航

为了实现VLN智能体,不仅需要学习理解语言语义和视觉环境,同时还要适应视觉语言交互情况下的动态变化,研究人员提出了一种对抗驱动的反事实思考方法。模型通过学习评价有效的反事实条件来代替采样充分但信息不足的数据,最终形成了一种比随机采样路径方法更为有有效的对抗策略。