(2020.6.27)深度强化学习初探

参考资料:https://github.com/wangshusen/DeepLearning/blob/master/LectureNotes/DRL/DRL.pdf

按照我个人的理解,其实不管是监督学习、自监督学习、无监督学习还是强化学习,实际上都是提供了一种解决问题的框架,真正要做好一个任务,是如何设计框架里面的细节。比如强化学习,如何设计好状态、动作、奖励。

(今天这篇写的真的是太敷衍了。。但是感觉最近水平有限实在想不出来该写啥了。。怎么办。。得想一个好的方向学一学。。。。。。)

猜你喜欢

转载自www.cnblogs.com/sqlkrad/p/13200237.html