行业资讯

AI news by Smartone AI

谷歌提出基于世界模型的的大规模强化学习方法

近年来随着强化学习的发展,使得智能体选择恰当行为以实现目标的能力得到迅速地提升。目前研究领域主要使用两种方法:一种是无模型(model-free)的强化学习方法,通过试错的方式来学习预测成功的行为,其