【推荐】快速超好用的RL强化学习框架——天授1500行代码实现DQN /PG/A2C

强化学习算法已经有各种实现平台,譬如基于tensorflow的OpenAI Baselines,rllib,基于Pytorch的 PyTorch DRL ,rlpyt。最新推荐一个轻量快速实现的RL框架,由清华大学的本科生推出,相比于之前的RL平台,有一下几点优势:

实现简洁,轻巧:1500行代码搞定
模块化:多种不同API可供调用,轮子多就是好
调用方便,速度快,3秒钟实现一个PG算法

RL算法框架比较:

在这里插入图片描述

强化学习框架 ——天授github项目地址
在这里插入图片描述

用天授实现DQN算法examples代码详情:
首先安装天授:

pip3 install tianshou

猜你喜欢

转载自blog.csdn.net/weixin_37479258/article/details/105235548