一起啃PRML

一起啃PRML - 1.2.2 Expectations and covariances 期望和协方差

@copyright 转载请注明出处 http://www.cnblogs.com/chxer/ 

 

涉及到概率的一个重要的操作是寻找函数的加权平均值。在概率分布p(x)下,函数f(x)的平均值被称为f(x)的期望(expectation),记作E[f]。对于一个离散变量,它的定义为:

因此平均值根据x的不同值的相对概率加权。在连续变量的情形下,期望以对应的概率密度的积分的形式表示:

 

类似的,我们有“条件期望”。无非就是把边缘概率变成条件概率。

 

在连续变量的情况下,我们把求和改成积分就好了。

 

如果我们给定有限数量的N 个点,这些点满足某个概率分布或者概率密度函数,那么期望可以通过平均的方式估计:

 

可以看出,当点数足够多,即N趋向于无穷大的时候,估计变得精准。

 

f(x)的方差被定义为:

 

方差是干什么的呢,它度量了f(x)在均值E[f(x)]附近变化性的大小。

我们可以把期望大概看成一个不错的平均值吧。

 

如果我们把方差展开,则会得到一个关于f(x)f(x)2的期望的式子

 

 

。。。。。

。。。。。

。。。。。

我去,这一步的推导真是太66666666666了

太!6!了!

书里真是轻!描!淡!写!就过去了!!!!

太!6!了!

我们都是天才吗一步就能看懂!!!

太!6!了!

 

幸好请教了伟大的学姐,真是,无!力!吐!槽!

如果只是我的智商低,请忽略这一段,谢谢,关爱智障儿童。。。

 

期望的运算还真是有讲究。

书里轻描淡写的展开实际过程应该是:

 

其实就是几个运算律来回用:

E[A-B]=E[A]-E[B]

E[E[A]]=E[A]

E[A*B]=E[A]*E[B] (A,B相互独立时)

 

行吧。我服了。

要是整本书都是这些“展开”,那真是要死了。

 

作为一个只有高一数学基础的中学生已经很难了好不好。。。

好我们继续。

 

当然了,我们不仅可以关心函数,更可以关心我们的自变量本身,于是有: 

有一个变量的方差,我们就有两个变量的方差,在这里我们称之为“协方差”,它是这么定义的:

 

看起来和方差长得一模一样。同理可以展开。

那么协方差是干什么用的呢?它表示在多大程度上xy会共同变化。也就是说,如果x,y相互独立,x和y的协方差就是0。还记得篮子和苹果的例子吗?

 

有两个变量的协方差,我们就有向量的协方差,它是这么定义的:

 

可以看出,两个向量的协方差是个矩阵。每两个元素一一对应求协方差。

 

当这两个向量长得一样的时候,其实就是求自己和自己的协方差,我们有一个偷懒的记号:

 

那么这个表示一个向量内元素之间共同变化的程度。等以后配合上实例再谈这些应该会更好一些。

原文地址:https://www.cnblogs.com/chxer/p/5348093.html