图解深度强化学习（简单的）

在这里插入图片描述
其实理解起来就是环境是一个根据输入输出响应信息的一个标注器
其他的就是一个神经网络，
只不过输入和输出是环境的输入和输出，神经网络就是智能体。代替和模拟其他左右动作，就人类环境而言，我们是和环境学习的一切，环境的变化和智能体的响应就构成了学习，那么在过去的人工智能深度神经网络为什么没有出现人类智慧呢，其实有智没有会，原因不得而知，原因有可能是输出过于单一，输入和输出不是真正的逻辑对应关系，或者说对应的逻辑关系比较单一，如果多模态输出，就极有可能让神经网络可以实现智能，实现人类的意识输出，比如输入一个图输出，不仅仅是分类，而是多样的比如环境什么，还有输入也是单一的，一个图不同时间代表的意义也是不同的，所以输入也要多模态输出也要多模态，才会是一个智能体。
如今研究界研究的也只是单一的输入输出多模态而已，但是以及能提高之前单一神经网络的智能了，如果能多对多的输入，输出。就能建立一个真正的智能，其实也没有那么多输入，大致人脑的输入，是图声等
其他的可以人类自定义一些数据输入就可以，不必太真实。
如果为了真实可以模拟一个虚拟的世界让，人工智能学习。
比如游戏世界，中可以体会到风，体会到重量，这都是可以模拟的
其实为什么要输入那么多，原因很简单，你要模拟 x 和y的关系不说明x是什么，那么机器永远要猜你要输入是什么，这就是神经网络需要大量数据输入的原因，如果是多模态的可能不需要那么多数据就学会了
输出也是一样的一个图输入，对于现在单一的y来说，信息太多还都是么有的，首先神经网络要剔除那些么有用的信息，才会开始找对应关系
可以这样理解输入的图是10个数，每个数的状态有十个，而你要建立的是其中一个数的某几个状态和y的关系，那么神经网络要剔除 9*10状态信息，如果是一张图，会更多多余的信息系对于y来说。

图解深度强化学习（简单的）

猜你喜欢