1、标量估计
若我们有观测量
y=x+w,其中
w∼N(0,2N0),为了从独立的AWGN中获得零均值实信号
x的估值
x^,我们采用MSE估计,即
MSE:=E[(x−x^)2],这里的平均既是针对随机信号
x的,也是针对噪声
w的。估计问题与高斯噪声中的检测问题有很大不同,因为检测是要在有限种可能中做出判断,而估计问题却是要获得估计值。
下面我们先从无观测时的估计出发,随后再讨论有观测的情况。
(1)情况1: 只有X的PDF可知
现在有一随机变量
X,想要对其进行估计,假定其PDF
pX(x)已知,则其MSE为
MSE=E[(X−x^)2]=∫(x−x^)2pX(x)dx.为了最小化MSE,我们求其关于
x^的一阶导数,有
−2∫(x−x^)pX(x)dx=0,因此
∫x^pX(x)dx=∫xpX(x)dx,即
x^=E[X]。进一步,我们求MSE关于
x^的二阶导数,有
2∫pX(x)dx=2>0,即当
x^=E[X]时,MSE最小。这样我们可以得到最小MSE为
MSE=E[(X−x^)2]=E[(X−E[X])2]=var[X].
【小结】如果我们知道随机变量
X的PDF,则当其估计值
x^=E[X]时候,能够得到最小MSE,这个最小MSE就是
X的方差。
(2)情况2: 与X相关的随机变量Y的观测值可知
若我们有观测量
Y=X+W,其中
W∼N(0,2N0)为独立的AWGN,则可以用后验概率密度函数
pX∣Y(x∣y)来代替
px(x)。现在我们的目标是最小化
MSE:=E[(X−x^(y))2∣Y=y]=∫(x−x^(y))2pX∣Y(x∣y)dx,这里我们引入
x^(y)是想表示与测量值
Y的特定取值
y相关联的估计值
x^(这意味着不同的
y会有不同估计值
x^),不过为了表达式看起来更简洁,下文中我们用
x^代替
x^(y)。与无测量情况相同,我们求一阶导数:
−2∫(x−x^)pX∣Y(x∣y)dx=0,因此可以得到
x^=∫xpX∣Y(x∣y)dx=E[X∣Y=y].与之相关的MMSE为条件方差
σY∣X2。显然与无测量时的唯一区别在于,我们将测量值作为条件。
【小结】如果我们知道与随机变量
X相关的随机变量
Y=y(观测量),则当
X的估计值
x^=E[X∣Y=y]时候,能够得到最小MSE,这个最小MSE就是条件方差
σY∣X2。
下面我们来说明问什么MMSE估计器具有正交性质,即误差与观测量独立:
E[(X−x^)Y]=0.
证明:
由于
x^为
X的估计值,因此有
EXY[x^Y]=∫−∞∞∫−∞∞x^ypX,Y(x,y)dxdy
=∫−∞∞ypy(y)[∫−∞∞x^pX∣Y(x∣y)dx]dy,对于MMSE估计,由于
x^=E[X∣Y=y],因此有
EXY[x^Y]=∫−∞∞ypy(y)[∫−∞∞xpX∣Y(x∣y)dx]dy
=∫−∞∞∫−∞∞xypX,Y(x,y)dxdy=EXY[XY].故可以得到
EXY[(X−x^)Y]=0.获证。
显然,决定MMSE正交特性的关键原因是,此时的估计值
x^就是
X在
Y=y时候的条件均值,即
x^=E[X∣Y=y]。一般来说,条件均值算子
E[X∣y]是关于
y的复杂非线性函数。为了简化分析,我们假定该算子是线性的,由于
x的均值为零,则有
x^=cY。事实上,当
x是高斯随机变量时,这个假定不失一般性,因为在这种情况下,条件平均算子确实是线性的。
下面我们来看如何获得
c?由MMSE的正交性可以得到
E[(X−cY)Y]=0,因此,有
E[X2]=cE[X2]+cE[W2],故
c=E[X2]+N0/2E[X2].对该结果直觉上的理解是,我们用发送信号能量(
E[X2])在总接收能量(
E[X2]+N0/2)中所占的比例大小,对接收信号
y进行加权。此时相应的MMSE为
E[(X−x^)2]=E[(X−cY)2]=c⋅2N0,即
MMSE: E[X2]+N0/2E[X2]⋅2N0.
2、实向量空间中的估计
现在考虑在向量空间中估计
X,即
y=hx+w,这里的
x与
w∼N(0,2N0I)相互独立,
h∈Rn。已知
y到
h方向上的映射
y~=∣∣h∣∣2hTy=x+w是充分统计量,这是因为
y到与
h正交方向上的映射与信号
x以及
w(
h方向上的噪声)都正交。这样我们就可以将问题变为标量估计:从
y~中估计
x,其中
w∼N(0,2∣∣h∣∣2N0)。因此,应用MMSE估计,可以得到
x的最优线性估计为
x^=E[X2]∣∣h∣∣2+N0/2E[X2]∣∣h∣∣2y~,根据
x^=cTy,可得
c=E[X2]∣∣h∣∣2+N0/2E[X2]h,以及
MMSE=E[X2]∣∣h∣∣2+N0/2E[X2]⋅2N0.
另外一种衡量线性估计器性能的指标是信噪比
SNR:=∣∣c∣∣2⋅2N0(cTh)2E[x2],定义为估计中信号能量与噪声能量的比值,这是由
x^=cTy得到的。
3、复向量空间中的估计
将我们的讨论扩展到复数域是很自然的。我们首先考虑复数标量估计
y=x+w,这里
w∼CN(0,N0)与零均值发送信号
x独立。假定线性估计
x^=c∗y,有
MSE=E[∣x−x^∣2]
c=E[∣x∣2]+N0E[∣x∣2],
MMSE=E[X2]+N0E[X2]N0.
MMSE的正交性为
E[(x^−x)y∗]=0.
下面考虑如何在复向量空间里估计标量
x
y=hx+w,其中
w∼CN(0,N0I)与
x独立,且
h∈Cn.与实向量空间类似,我们可以得到
y~=∣∣h∣∣2hHy=x+w,其中,
w∼CN(0,∣∣h∣∣2N0)。因此,最优估计器为
c=E[X2]∣∣h∣∣2+N0E[X2]h,以及
MMSE=E[X2]∣∣h∣∣2+N0E[X2]⋅N0.