Gaussian Distribution
高斯分布(Gaussian Distribution)是一种连续概率分布,也称为正态分布(Normal Distribution)。高斯分布的概率密度函数(Probability Density Function, PDF)为:
其中,
其中,
高斯分布的性质
- 高斯分布是一个钟形曲线,左右对称,中心点为均值
- 标准差
决定了曲线的宽窄,标准差越大,曲线越矮胖;标准差越小,曲线越瘦高 - 高斯分布的期望值为均值
,方差为 - 高斯分布的协方差矩阵
是对称正定矩阵 - 高斯分布的边缘分布是高斯分布(边缘分布是指将多元高斯分布中的某几个维度的变量积分掉后得到的分布)
- 高斯分布的条件分布是高斯分布(条件分布是指在已知某些变量的情况下,对另一些变量的分布)
- 高斯分布的线性变换仍然是高斯分布(线性变换是指
,其中 是矩阵, 是向量)
高斯分布会在不同的问题中产生,例如:
- 对于一个一元实值向量,使熵最大的分布是高斯分布
- 中心极限定理表明,独立同分布的随机变量和服从任意分布的随机变量的和,当样本量足够大时,其分布会趋近于高斯分布
高斯分布中的均值与方差的计算
首先,考虑高斯分布的二次型:
其中,
实对称正定矩阵的性质
对于一个实对称正定矩阵
其中,
使用上面的公式代入二次型,有:
令
高斯分布的几何理解
本质上,高斯分布的一般形式都可以看作是在标准形式
这样,我们可以代入高斯分布的概率密度函数,得到:
这样,我们可以看出,高斯分布的每一个维度都是独立的,且服从标准正态分布
高斯分布的局限性
高斯分布的局限性主要体现在以下几个方面:
- 高斯分布参数量大,而且求逆计算的计算复杂度高,对于高维数据,计算量会很大
- 高斯分布本质是单峰,因此不能很好的近似多峰分布
解决这类的问题,我们可以通过引入潜在变量(隐藏变量、未观察变量)来解决,例如混合高斯分布