前言
前段时间各大新闻媒体都在报道SpaceX的马斯克,因为其公司成功发射“猎鹰9号”火箭。马斯克是一个极具传奇色彩的人物,其成就也足以让他名垂青史。但今天我们要讨论的不是马斯克这个人,而是马斯克牵头建立的人工智能非营利组织OpenAI下一个强化学习工具库Gym,它可以被用来开发和比较强化学习算法。
简单的说,gym就是提供了强化学习中与agent交互的environments,gym中的环境都留出了供我们设计算法的相应接口,这为我们节省了不少事。下面就来看看这个gym库里有哪些东西吧~
安装
要求Python版本大于3.5,使用pip可以简单安装。
pip install gym
这种安装方法并没有安装gym中的全部环境,只包括了
- algorithmic
- toy_text
- classic_control
这三种类型的环境,另外还有Atari,Box2d和MuJoCo。按照自己的需要可以按照github上的指导进行安装。
环境(Environments)
下面是一个CarPole的例子,运行下面的代码就可以完成1000步:
import gym
env = gym.make('CartPole-v1')
env.reset()
for _ in range(1000)<