人工智能 一种现代方法 第2章 智能Agent

Agent及其理性

Agent:通过传感器感知所处环境并通过执行器对该环境产生作用的智能体
Agent感知序列:该Agent所接收到的是所有输入数据的完整历史
感知信息:智能体的感知输入
感知序列:感知信息的集合
Agent函数:描述Agent行为,将任意给定感知序列映射为行动
Agent程序:实现Agent函数

The agent function describes what the agent does in all circumstances
The agent program calculates the agent function

理性的概念

理性:Agent的一种属性,考虑到迄今为止的感知,他们选择能够最大化其预期效用的行为。
理性(Rationality)Agent:对于每个可能的感知序列,根据已知的序列提供的证据和智能体内建的先验知识,理性智能体应该选择期望能使其性能最大化的行动。
Rationality depends on:

  • The performance measure that defines the criterion of success
  • The agent’s prior knowledge of the environment
  • The actions that the agent can perform
  • The agent’s percept sequence to date
    性能度量、先验知识、可执行行动、感知序列

全知Agent:全知Agent明确知道他的行动产生的实际结果并做出相应的动作,现实中不可能。理性 ≠ 全知
完美Agent:理性Agent使期望性能最大化;完美Agent使实际性能最大化。理性 ≠ 完美

理性Agent还应该是自主的,它应该学习,以弥补不完整的或者不正确的先验知识。

PEAS及环境特性

任务环境的规范包括:
To design a rational agent we need to specify a task environment

  • Performance measure
  • Environment
  • Actuators
  • Sensors

PEAS(性能Performance,环境 Environment, 执行器Actuators, 传感器Sensors)

例如,在Spam Filtering垃圾邮件过滤中

  • Performance measure: spam block
  • Environment: email client or server
  • Actuators: mark as spam, transfer messages
  • Sensors: emails (possibly across users), etc.

任务环境的属性

  • 完全可观测和部分可观测
    Agent的Sensors在每个时间点上都能获取环境的完整状态。若监测到的信息与行动决策相关,则该任务环境是有效完全可观察的。
  • 单Agent和多Agent
  • 确定的和随机的
  • 片段式的和延续式的
    片段:下一个片段不依赖于以前片段采取的行动(如大部分的分类任务)。
    连续:当前决策会影响到所有未来决策。
  • 静态的和动态的
    取决于环境在Agent计算时是否会改变。
  • 离散的和连续的
    环境状态,时间处理方式,Agent感知信息和行动 都有离散和连续之分。

Agent的结构

Agent = 体系结构 + 程序(Agent程序)
体系结构,具有物理传感器和执行器的计算装置
智能体程序,每接收到一个新的感知信息,就将其添加到感知序列中,并根据先验知识的对应表得到一个行动,把传感器的感知信息映射到行动的Agent函数

All agents have the same skeleton

  • Input = current percepts
  • Output = action
  • Program= manipulates input to produce
    output

Four basic types in order of increasing generality

  • Simple reflex agents 简单反射agent,忽略感知序列,而只针对当前感知选择行动。
  • Model-based reflex agents 基于模型的agent
  • Goal-based agents 基于目标的agent
    基于目标的agent会考虑将要采取的行动及行动的后果,即与目标还有多远
  • Utility-based agents 基于效用的agent,最大化期望
  • Learning agents 学习agent
    All these can be turned into learning agents

Agent程序的部件如何运转

各部件的工作

  • 原子表示
  • 要素化表示(状态有特征向量)
  • 结构化表示(特征向量+其他对象的关系)

小结

要点回顾如卜:
Agent是可以感知环境并在环境中行动的事物。
Agent函数指定Agent响应任何感知序列所采取的行动。

性能度量评价Agent在环境中的行为表现。给定Agent的感知序列,理性Agent行动追求性能度量预期值最大化

任务环境的规范包括性能度量,外部环境,执行器和传感器。设计Agent时,第一步总是把任务空间定义得尽可能完全。

任务环境从不同的维度看有很多变化。它们可能是完全或部分可观察的,单Agent或多Agent的,确定性的或随机的,片段式的或延续式的,静态的或动态的,离散的或连续的,已知的和未知的。

Agent程序是Agent函数的实现。 有各种基本的Agent程序的设计,反映出显式表
现的以及用于决策过程的信息种类。设计可能在效率、压缩性和灵活性方面有变化。适当的 Agent 程序的设计依赖于环境的本性。

简单反射Agent直接对感知信息做出反应。基于模型的反射Agent保持内部状态,其操作直接从当前世界状态的内部模型派生,并随时间更新。基于目标的Agent选择能实现显示表示的目标的动作,而基于效用的Agent试图选择能最大化它期望效用的动作。

所有Agent都可以通过学习来改进它们性能。

资源分享

实验代码下载:
https://github.com/yyl424525/AI_Homework
人工智能-一种现代方法中文第三版pdf、课件、作业及解答、课后习题答案、实验代码和报告、历年考博题下载:https://download.csdn.net/download/yyl424525/11310392

猜你喜欢

转载自blog.csdn.net/yyl424525/article/details/95307376