在统计学及概率理论中,离散型均匀分布是离散型概率分布,其中有限个数值拥有相同的概率。离散型均匀分布的另一种说法为“有限个结果,各结果的概率均相同”。
离散型均匀分布
概率质量函数 n=5 where n=b-a+1 |
累积分布函数 |
参数 |
|
---|
值域 |
|
---|
概率质量函数 |
|
---|
累积分布函数 |
|
---|
期望 |
|
---|
中位数 |
|
---|
众数 |
N/A |
---|
方差 |
|
---|
偏度 |
|
---|
峰度 |
|
---|
熵 |
|
---|
矩生成函数 |
|
---|
特征函数 |
|
---|
像均匀的骰子就是离散型均匀分布的例子,可能的值为1, 2, 3, 4, 5, 6,而每一个数字的概率都是1/6。但若同时丢二个均匀骰子,将其值相加,就不是离散型均匀分布了,因为各个和的概率不同。
离散型均匀分布常用来描述结果为数字的分布,不过离散型均匀分布也可以描述结果是有限集合的分布。例如随机置换就是由已知长度的置换中均匀随机产生的组合,而均匀生成树是由给定的树中均匀随机产生的生成树。
离散型均匀分布在本质上是非参数(non-parametric)的。不过要表示其值很容易,就用[a,b]之间的所有整数即可,因此a和b就是离散型均匀分布的主要参数(也常常改为考虑区间[1,n],只保留一个参数n)。若用这种表示法,针对任意k ∈ [a,b]的累积分布函数(CDF)为
我们将会讨论德国坦克问题的例子,将最大值估计应用于二战期间德国坦克产量的估计。
设k 个观测值的样本是从一下整数的均匀分布中获得的:
而问题就是估计未知的最大 N。
最大值的均匀最小方差无偏 (UMVU) 估计量为下列式子: 其中 m 是样本最大值,k 是样本大小,而且无放回抽样。 这可被看作为最大间距估计的一个非常简单的例子。
这个式子也有一个变样版本:
该式中的标准差被大约表示为 ,也就是样本之间差距的平均大小,与 作比较。
样本最大值是总体最大值的最大似然估计,然而,该方法存在偏差。
若样本没有编号但可被识别或标记,则可透过捕获再捕获方法以估计族群规模。
有关均匀分布随机排列的固定点数量的概率分布的说明,请参阅主条目。