概率机器人中概率的基本概念

从上一章,我们已经学到,概率机器人学是通过数学上概率的方式描述各种不确定性,进而处理机器人问题的科学。
第二章:递归状态估计,主要介绍以下三个部分:
(1)概率的基本概念
(2)机器人的环境交互
(3)贝叶斯滤波

本篇文章只总结概率的基本概念

首先介绍状态估计,概率机器人技术的核心是由传感器数据来估计状态的思路。状态估计解决的是从不能直接观测但可以推断的传感器数据中估计数量的问题。状态估计旨在从数据中找回状态变量。概率状态估计算法在可能的状态空间上计算置信度分布。上一章机器人定位的例子就是概率状态估计的实例。

本节主要总结的知识点如下图所示,并且需要熟悉使用这些基本符号。
在这里插入图片描述
随机变量:
在概率机器人建模时,如传感器测量、控制、机器人的状态以及环境这些都可以作为随机变量。这些随机变量可以根据具体的概率定律取不同的值。

这里,令X表示一个随机变量,x表示X的某一个特定值。比如掷硬币,x可以是正、反,X可以取正反两种状态。这里首先要清楚X的状态空间是离散的
所以用p(X=x)来表示随机变量X具有x的概率,为了简化符号,通常省略随机变量的明确表示,常用缩写p(x)表示p(X=x)。离散概率分布和总为1。中学内容,大家都懂。
下面为了方便理解,直接用图对比说明连续和离散空间下的概率表示以及连续空间下的正态分布。
在这里插入图片描述
正态分布:
普通的密度函数都是具有均值μ和方差σ^2的一维正态分布。正态分布的概率密度函数可以用高斯函数求出:
在这里插入图片描述
正态分布,本书用N(x, μ,σ^2)来表示,他指出随机变量及其均值和方差。
多元正态分布:
上面式子x是一个标量值,但是在应用中x多是一个多维矢量,矢量的正态分布称为多元正态分布,多元正态分布的概率密度函数可以用高斯函数求出:
在这里插入图片描述
式子中,μ是均值矢量,Σ是半正定对称矩阵又称为协方差矩阵,上标T转置符号。
观察上面两个式子是严格泛化的。
正如离散概率分布和总为1,连续的一个概率密度函数的积分也总为1,但是概率密度函数的上限不限于1。
联合分布:
两个随机变量X和Y的联合分布,由下式给出:
p(x,y)=p(X=x,Y=y)
p(x,y)=p(x|y)p(y)=p(y|x)p(x)
描述了随机变量X取值为x并且Y取值为y这个事件的概率。若X和Y相互独立
p(x,y)=p(x)p(y)
p(x|y)=p(x)
p(y|x)=p(y)
条件概率:
假设在知道Y的值是y的条件下,X是x的概率,由下式给出:
p(x|y)=p(X=x|Y=y)
若p(y)>0,则条件概率为
在这里插入图片描述
解释为:在y发生的条件下,x和y都发生的概率
若X和Y相互独立,则有
在这里插入图片描述
全概率定理:
想要通过p(x|y)和p(y)求出p(x)的概率
离散情况:
在这里插入图片描述
连续情况:
在这里插入图片描述
贝叶斯准则:
通过条件概率p(x|y)的“逆”概率p(y|x)来求p(x|y),且p(y)>0
离散情况:
在这里插入图片描述
连续情况:
在这里插入图片描述
先验概率分布:
如果x是一个希望由y推测出来的数值,则称p(x)为先验概率分布
后验概率分布:
概率p(x|y)称为在X上的后验概率分布,贝叶斯准则提供了通过“逆”条件概率p(y|x)和先验概率p(x)去求后验概率的方法。在机器人学中,概率p(y|x)经常被称为生成模型,在一定的抽象层面上,它表示状态变量X如何引起了检测数据Y。
这里注意到,贝叶斯准则的分母p(y)不依赖x,所以p(y)^(-1)经常写成贝叶斯准则中的归一化变量,用η表示:
在这里插入图片描述
在不同的公式中,将自由的用同一个η来表示归一化,即使它们的实际值是不同的。
加入第三个随机变量Z:
只要 p(y|z)>0, 关于 Z=z 的贝叶斯准则有
在这里插入图片描述
类似的,以其他变量z为条件的相互独立的随机变量条件联合概率定律:
在这里插入图片描述
这种关系称为条件独立(在Z发生的条件下,x和y的发生与否相互独立)。满足上定律的称为条件独立。
若X,Y关于事件Z条件独立,则有以下一些理解:
(1)事件 Z 的发生,使本来可能不独立的事件X和事件Y变得独立起来;
(2)事件Z 的出现或发生,解开了X 和 Y 的依赖关系
上面式子等价于
在这里插入图片描述
条件独立不意味着绝对独立
在这里插入图片描述
绝对独立也不意味着条件独立
在这里插入图片描述
特殊情况下条件独立和绝对独立可能是一致的。
随机变量的期望:

离散情况:
在这里插入图片描述
连续情况:
在这里插入图片描述
本书讨论的都是具有有限期望的随机变量。
期望是随机变量的线性函数。
在这里插入图片描述
随机变量的协方差:
在这里插入图片描述
熵:
一个概率分布的熵如下表示:
在这里插入图片描述
熵的概念起源于信息论。熵是x所携带的期望信息。
离散情况下,假定p(x)是观测x的概率,则-log2p(x)就是使用最佳编码对x进行编码所需要的比特数。

到这里关于概率机器人的基本概率概念就总结完成了。
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/zhao_ke_xue/article/details/105120830