Chapter 1 - 2 欢迎来到深度强化学习

  1. 需要将真实世界的问题首先抽象为 Markov Decision Processes (MDPs),然后才可以使用强化学习方法去求解。

课程划分:

1 强化学习基础

2 基于值的方法

3 基于策略的方法

4 多智能体强化学习

项目内容

1 训练一个智能体能够搜集黄香蕉,同时避免碰到蓝色香蕉在这里插入图片描述

2 训练一个机械臂到达目标位置

在这里插入图片描述

3 训练一对智能体打网球

在这里插入图片描述

发布了9 篇原创文章 · 获赞 0 · 访问量 163

猜你喜欢

转载自blog.csdn.net/weixin_37532614/article/details/104683282