【荐读IEEE TPAMI】基于模型的强化学习与独立想象力

题目:Model-Based Reinforcement Learning With Isolated Imaginations

基于模型的强化学习与独立想象力

作者:Minting Pan; Xiangming Zhu; Yitao Zheng; Yunbo Wang; Xiaokang Yang


摘要

在基于视觉的交互系统中,世界模型学习行动的后果。然而,在实际场景中,如自动驾驶,存在不可控制的动态,这些动态独立于或与行动信号稀疏相关,这使得学习有效的世界模型变得具有挑战性。为了解决这个问题,我们提出了Iso-Dream++,这是一种基于模型的强化学习方法,具有两个主要贡献。首先,我们优化了逆动力学,鼓励世界模型从环境混合的时空变化中隔离出可控制的状态转换。其次,我们基于解耦的潜在想象进行策略优化,我们将不可控制的状态滚动到未来,并将其与当前可控制的状态自适应地关联起来。这使

猜你喜欢

转载自blog.csdn.net/qq_42722197/article/details/139001818
今日推荐