强化学习——环境库OpenAI Gym

前言

前段时间各大新闻媒体都在报道SpaceX的马斯克,因为其公司成功发射“猎鹰9号”火箭。马斯克是一个极具传奇色彩的人物,其成就也足以让他名垂青史。但今天我们要讨论的不是马斯克这个人,而是马斯克牵头建立的人工智能非营利组织OpenAI下一个强化学习工具库Gym,它可以被用来开发和比较强化学习算法。

简单的说,gym就是提供了强化学习中与agent交互的environments,gym中的环境都留出了供我们设计算法的相应接口,这为我们节省了不少事。下面就来看看这个gym库里有哪些东西吧~

安装

要求Python版本大于3.5,使用pip可以简单安装。

pip install gym

这种安装方法并没有安装gym中的全部环境,只包括了

  • algorithmic
  • toy_text
  • classic_control

这三种类型的环境,另外还有Atari,Box2d和MuJoCo。按照自己的需要可以按照github上的指导进行安装。

环境(Environments)

下面是一个CarPole的例子,运行下面的代码就可以完成1000步:

import gym
env = gym.make('CartPole-v1')
env.reset()
for _ in range(1000)<

猜你喜欢

转载自blog.csdn.net/ys707663989/article/details/106452346