我的专属小窝

参数估计

参数估计是什么?

现在有一些样本x,假设他们服从某种分布(例如高斯分布),但是我们并不知道该分布的参数,我们通过这些样本估计出未知的参数,这就是参数估计。

有什么前提?

样本是独立同分布的,且训练样本足够充分。 如果样本不是同一个分布,那么我们的假设(他们服从某种分布)就是错误的。 如果训练样本过少,估计出来的参数就会有偏差。

最大似然估计

反过来考虑,假设存在某个数据流满足高斯分布,我们从中抽出部分样本x,很直观的,我们可以用x的均值和方差来作为数据流的均值和方差的近似值,而当我们把样本的数量逼近无穷时,估计的参数值就收敛于真实值。 而当我们拥有样本x,并假设其满足某种分布时,同样可以用样本来估计参数值。

贝叶斯估计

最大似然估计仅仅使用了样本信息,而贝叶斯估计在其之上,又对参数进行了约束。 贝叶斯估计假设参数不再是一个固定的值,而是一个服从某种分布的变量,通过样本和参数的分布,对参数的值进行估计。 反过来考虑,假设存在某个数据流满足高斯分布,同时该高斯分布的参数值不是确定的,而是满足另一个高斯分布的随机变量。也就是说,每次对该数据流进行采样时,面对的都是一个随机的高斯分布,而该高斯分布的参数满足另外一个高斯分布。

递归

贝叶斯估计对样本的参数进行了约束,假设样本服从的分布的参数是随机变量,服从第二个分布,同样我们可以假设第二个分布的参数也是随机变量,服从第三个分布…由此可以嵌套若干层。