强化学习系列课程(一)强化学习概论

1. 整体结构

2. 奖励,动作、状态

2

3. 策略

3

4. 值函数

4

5. 模型

5

发布了87 篇原创文章 · 获赞 149 · 访问量 7万+

猜你喜欢

转载自blog.csdn.net/weixin_43795921/article/details/104488730