p ( θ ∣ x ) = p ( x ∣ θ ) p ( θ ) p ( x ) p(\theta|x)=\frac{p(x|\theta)p(\theta)}{p(x)} p(θ∣x)=p(x)p(x∣θ)p(θ)
其中 p ( θ ∣ x ) p(\theta|x) p(θ∣x) 后验分布 posterior: θ \theta θ 基于 x x x 的分布 p ( θ ) p(\theta) p(θ) 先验分布 prior: θ \theta θ 自身的分布 p ( x ∣ θ ) p(x|\theta) p(x∣θ) 似然 likelihood: x x x 基于 θ \theta θ 的分布 p ( x ) p(x) p(x) evidence: 常数,不重要
如果把 θ \theta θ 看做原因, x x x 看做结果,那么 (1)后验分布 = 由结果估计原因的概率分布 (2)先验分布 = 原因自身的概率分布 (3)似然 = 根据原因估计结果的概率分布
因此,贝叶斯公式的重要意义就是在于,如果知道
原因自身的概率分布结果基于原因的概率分布(这样的因果逻辑在我们看来是正常的)就能求得 原因基于结果的概率分布(这个看起来因果颠倒,但这正式贝叶斯公式的作用,即从结果推断原因)