概率质量函数

PMF,統計學名詞

概率论统计学中,概率质量函数(probability mass function,简写作pmf)是离散随机变数在各特定取值上的概率[1]。有时它也被称为离散密度函数。 概率密度函数通常是定义离散概率分布的主要方法,并且此类函数存在于其定义域是离散的标量变数或多元随机变数英语Multivariate random variable

一个概率密度函数的图像。函数的所有值必须非负,且总和为1。

概率质量函数概率密度函数的一个不同之处在于:概率质量函数是对离散随机变数定义的,本身代表该值的概率;概率密度函数本身不是概率,只有对连续随机变数的概率密度函数必须在某一个区间内被积分后才能产生出概率[2]

具有最大概率密度的随机变数的值称为众数

数学定义

编辑

假设X是一个定义在可数样本空间S上的离散随机变数 SR,则其概率质量函数 fX(x) 为

 

注意这在所有实数上,包括那些X不可能等于的实数值上,都定义了 fX(x)。在那些X不可能等于的实数值上, fX(x)取值为0 ( xR\S,取Pr(X = x) 为0)。

离散随机变数概率质量函数的不连续性决定了其累积分布函数也不连续。

例子

编辑

概率质量函数可以定义在任何离散随机变数上,包括常数分布, 二项分布(包括伯努利(Bernoulli)分布), 负二项分布, 泊松(Poisson)分布, 几何分布以及超几何分布随机变数上.

有限

编辑

存在三个相关的主要分布,伯努利分布二项式分布、和几何分布

伯努利分布

编辑

伯努利分布:ber(p) ,用于对只有两种可能结果的实验进行建模。 这两个结果通常编码为1和0。

 

一个伯努利分布的例子是抛硬币。假设X是抛硬币的结果,反面取值为0,正面取值为1。则在状态空间{0, 1}(这是一个伯努利(Bernoulli)随机变量)中,X = x的概率是0.5,所以概率质量函数

 

无限

编辑

以下呈指数下降的分布是具有无限数量可能结果的分布示例——所有正整数:

 

尽管可能的结果有无限多,但总概率密度为 1/2 + 1/4 + 1/8 +⋯ = 1,满足概率分布的单位总概率要求。

多变量情况

编辑

两个或多个离散随机变量具有联合概率密度函数,它给出了随机变量的每个可能的实现组合的概率。

参见

编辑

参考文献

编辑

Template:概率分布理论