人工智能一种现代方法第2章智能Agent

文章目录

Agent及其理性

理性的概念

PEAS及环境特性
Agent的结构
Agent程序的部件如何运转
小结
资源分享

Agent及其理性

Agent：通过传感器感知所处环境并通过执行器对该环境产生作用的智能体
Agent感知序列：该Agent所接收到的是所有输入数据的完整历史
感知信息：智能体的感知输入
感知序列：感知信息的集合
Agent函数：描述Agent行为，将任意给定感知序列映射为行动
Agent程序：实现Agent函数

The agent function describes what the agent does in all circumstances
The agent program calculates the agent function

理性的概念

理性：Agent的一种属性，考虑到迄今为止的感知，他们选择能够最大化其预期效用的行为。
理性（Rationality）Agent：对于每个可能的感知序列，根据已知的序列提供的证据和智能体内建的先验知识，理性智能体应该选择期望能使其性能最大化的行动。
Rationality depends on：

The performance measure that defines the criterion of success
The agent’s prior knowledge of the environment
The actions that the agent can perform
The agent’s percept sequence to date
性能度量、先验知识、可执行行动、感知序列

全知Agent:全知Agent明确知道他的行动产生的实际结果并做出相应的动作，现实中不可能。理性 ≠ 全知
完美Agent：理性Agent使期望性能最大化；完美Agent使实际性能最大化。理性 ≠ 完美

理性Agent还应该是自主的，它应该学习，以弥补不完整的或者不正确的先验知识。

PEAS及环境特性

任务环境的规范包括：
To design a rational agent we need to specify a task environment

Performance measure
Environment
Actuators
Sensors

PEAS（性能Performance，环境 Environment，执行器Actuators，传感器Sensors）

例如，在Spam Filtering垃圾邮件过滤中

Performance measure: spam block
Environment: email client or server
Actuators: mark as spam, transfer messages
Sensors: emails (possibly across users), etc.

任务环境的属性

完全可观测和部分可观测
Agent的Sensors在每个时间点上都能获取环境的完整状态。若监测到的信息与行动决策相关，则该任务环境是有效完全可观察的。
单Agent和多Agent
确定的和随机的
片段式的和延续式的
片段：下一个片段不依赖于以前片段采取的行动（如大部分的分类任务）。
连续：当前决策会影响到所有未来决策。
静态的和动态的
取决于环境在Agent计算时是否会改变。
离散的和连续的
环境状态，时间处理方式，Agent感知信息和行动都有离散和连续之分。

Agent的结构

Agent = 体系结构 + 程序（Agent程序）
体系结构，具有物理传感器和执行器的计算装置
智能体程序，每接收到一个新的感知信息，就将其添加到感知序列中，并根据先验知识的对应表得到一个行动，把传感器的感知信息映射到行动的Agent函数

All agents have the same skeleton

Input = current percepts
Output = action
Program= manipulates input to produce
output

Four basic types in order of increasing generality

Simple reflex agents 简单反射agent，忽略感知序列，而只针对当前感知选择行动。
Model-based reflex agents 基于模型的agent
Goal-based agents 基于目标的agent
基于目标的agent会考虑将要采取的行动及行动的后果，即与目标还有多远
Utility-based agents 基于效用的agent，最大化期望
Learning agents 学习agent
All these can be turned into learning agents

Agent程序的部件如何运转

各部件的工作

原子表示
要素化表示（状态有特征向量）
结构化表示（特征向量+其他对象的关系）

小结

要点回顾如卜:
Agent是可以感知环境并在环境中行动的事物。
Agent函数指定Agent响应任何感知序列所采取的行动。

性能度量评价Agent在环境中的行为表现。给定Agent的感知序列,理性Agent行动追求性能度量预期值最大化。

任务环境的规范包括性能度量,外部环境,执行器和传感器。设计Agent时,第一步总是把任务空间定义得尽可能完全。

任务环境从不同的维度看有很多变化。它们可能是完全或部分可观察的,单Agent或多Agent的,确定性的或随机的,片段式的或延续式的,静态的或动态的,离散的或连续的,已知的和未知的。

Agent程序是Agent函数的实现。 有各种基本的Agent程序的设计,反映出显式表
现的以及用于决策过程的信息种类。设计可能在效率、压缩性和灵活性方面有变化。适当的 Agent 程序的设计依赖于环境的本性。

简单反射Agent直接对感知信息做出反应。基于模型的反射Agent保持内部状态,其操作直接从当前世界状态的内部模型派生，并随时间更新。基于目标的Agent选择能实现显示表示的目标的动作,而基于效用的Agent试图选择能最大化它期望效用的动作。

所有Agent都可以通过学习来改进它们性能。

资源分享

实验代码下载：
https://github.com/yyl424525/AI_Homework
人工智能-一种现代方法中文第三版pdf、课件、作业及解答、课后习题答案、实验代码和报告、历年考博题下载：https://download.csdn.net/download/yyl424525/11310392