Bernoulli、Binomial、Beta 分布详解
本文关注 离散随机变量 discrete random variable 相关的分布;相对的,连续随机变量 continuous random variable 如经典的 高斯分布(Gaussian Distribution)会在其他文章中介绍。
到底什么是 distribution “分布” ?
分布是一个抽象的概念,从概率统计的角度说,分布是一个数学函数 that providing the probabilities of occurrence of different possible outcomes in an experiment.
通俗来说,分布可以看做是对 random variable 随机变量 的一种描述,分布可以给出所有 随机变量 的取值对应的概率(连续随机变量得到的是可能性PDF),这是正向过程。
我们真正观察到的结果只是采样,我们预测的结果只是期望值,而对于随机变量的分布本身,我们只能通过大量的采样来猜测(也可以结合先验知识),这是反向过程。
典型的离散随机变量的分布有:
- 伯努利分布(Bernoulli Distribution)
- 二项分布(Binomial Distribution)
- 分类分布(Categorical Distribution)
- 多项分布(Multinomial Distribution)
以及他们的共轭先验分布:
- 贝塔分布(Beta Distribution)
- 狄利克雷分布(Dirichelet Distribution)
貌似很多分布,但都以简单的 Bernoulli 为基础建立,非常规律,而且很多性质是相同的。本文将从 Bernoulli 展开介绍各个分布,给出最大似然的推导应用,最后再介绍 conjugacy 的概念。
1. 各分布详解
1.1 伯努利分布(又称 01分布)
这是最基本的离散随机变量的概率分布,相当于统计理论的 Hello World,我们记一个变量 y∈{ 1, 0} ,即某个事件或者试验只有两种结果,1或0,可以理解为发生或未发生;例如经典的抛硬币试验,我们只能得到俩种结果,heads or tails。
我们通常引入 μ∈[0,1] 的实数表示得到结果 y=1 的概率(例如硬币正面朝上):

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/47748.html