什么叫后验分布
后验分布(Posterior Distribution)是在贝叶斯统计中一个重要的概念。它指的是在观测到数据之后,对参数或潜变量的分布的更新。具体来说,后验分布是基于先验分布(Prior Distribution)和似然函数(Likelihood Function)通过贝叶斯定理计算得到的。
数学表达:
后验分布的计算公式为:
P ( θ ∣ D ) = P ( D ∣ θ ) P ( θ ) P ( D ) P(\theta | D) = \frac{P(D | \theta) P(\theta)}{P(D)} P(θ∣D)=P(D)P(D∣θ)P(θ)
其中:
- P ( θ ∣ D ) P(\theta | D) P(θ∣D) 是后验分布,即在观测到数据 D D D 之后对参数 θ \theta θ 的分布。
- P ( D ∣ θ ) P(D | \theta) P(D∣θ) 是似然函数,表示在参数为 θ \theta θ 的情况下,观测到数据 D D D 的概率。
- P ( θ ) P(\theta) P(θ) 是先验分布,表示在没有观测数据之前对参数 θ \theta θ 的信念。
- P ( D ) P(D) P(D) 是边际似然(Evidence),它是所有可能参数下似然的加权平均。
直观理解:
- 先验分布 反映了在没有数据时对参数的信念。
- 似然函数 反映了在给定参数的情况下,数据出现的可能性。
- 后验分布 结合了先验信息和观测到的数据,给出了更新后的参数分布。
应用:
后验分布用于许多贝叶斯分析中的决策、推断和预测,尤其在处理不确定性和结合先验知识方面,具有重要意义。