行业资讯

AI news by Smartone AI

谷歌助力智能体发现多样化可预测新技能

文章将介绍关于非监督强化学习的最新研究。在DAD方法中为非监督学习引入了可预测的优化目标,将技能的基础特性视为可以对环境带来可预测的改变,基于这一观点开发出了非监督强化学习技能发现算法,并在模拟实验中展示了其广泛适应性。