用python实现了一个推箱子游戏的环境,后面准备以此为基础实现强化学习。


最近买了个儿童照相机,里面有个推箱子的游戏。
同时,最近在学强化学习,之前也用Q-learning实现了走迷宫。
这次,咱正好试试强化学习是怎么玩推箱子的。~

一、环境设计核心要素

1.1 状态空间建模

采用二维网格编码(8x8),使用IntEnum定义七种地图元素:

class TileType(IntEnum):
    EMPTY = 0    # 空地
    WALL = 1