超几何分布(Hypergeometric distribution)是统计学上一种离散机率分布。它描述了由有限个物件中抽出 n {\displaystyle n} 个物件,成功抽出 k {\displaystyle k} 次指定种类的物件的概率(抽出不放回 (without replacement))。
1 n K ( N − K ) ( N − n ) ( N − 2 ) ( N − 3 ) ⋅ {\displaystyle \left.{\frac {1}{nK(N-K)(N-n)(N-2)(N-3)}}\cdot \right.} [ ( N − 1 ) N 2 ( N ( N + 1 ) − 6 K ( N − K ) − 6 n ( N − n ) ) + {\displaystyle {\Big [}(N-1)N^{2}{\Big (}N(N+1)-6K(N-K)-6n(N-n){\Big )}+{}}
例如在有 N {\displaystyle N} 个样本,其中 K {\displaystyle K} 个是不及格的。超几何分布描述了在该 N {\displaystyle N} 个样本中抽出 n {\displaystyle n} 个,其中 k {\displaystyle k} 个是不及格的个数:
上式可如此理解: ( N n ) {\displaystyle {\tbinom {N}{n}}} 表示所有在 N {\displaystyle N} 个样本中抽出 n {\displaystyle n} 个的方法数目。 ( K k ) {\displaystyle {\tbinom {K}{k}}} 表示在 K {\displaystyle K} 个样本中,抽出 k {\displaystyle k} 个的方法数目,即组合数,又称二项式系数。剩下来的样本都是及格的,而及格的样本有 N − K {\displaystyle N-K} 个,剩下的抽法便有 ( N − K n − k ) {\displaystyle {\tbinom {N-K}{n-k}}} 若 n = 1 {\displaystyle n=1} ,超几何分布退化为伯努利分布。
若随机变量 X {\displaystyle X} 服从参数为 n , K , N {\displaystyle n,K,N} 的超几何分布,则记为 X ∼ H ( n , K , N ) {\displaystyle X\sim H(n,K,N)} 。