强化学习算法已经有各种实现平台,譬如基于tensorflow的OpenAI Baselines,rllib,基于Pytorch的 PyTorch DRL ,rlpyt。最新推荐一个轻量快速实现的RL框架,由清华大学的本科生推出,相比于之前的RL平台,有一下几点优势:
实现简洁,轻巧:1500行代码搞定
模块化:多种不同API可供调用,轮子多就是好
调用方便,速度快,3秒钟实现一个PG算法
RL算法框架比较:
用天授实现DQN算法examples代码详情:
首先安装天授:
pip3 install tianshou