卜瓦松二項分布

機率論統計學中,卜瓦松二項分布是一個基於獨立伯努利試驗之和的離散機率分布。這一概念以西梅翁·德尼·泊松的名字命名。

卜瓦松二項分布
Poisson binomial
參數 (試驗數)
(各試驗的成功概率)
值域 k ∈ { 0, …, n }
機率質量函數
累積分布函數
期望值
變異數
偏度
峰度
動差母函數
特徵函數
機率母函數

換句話說,它是成功概率分別為n獨立伯努利試驗中,成功次數的機率分布。普通二項分布是卜瓦松二項分布在所有成功機率相同(即)時的特例。

定義

編輯

機率質量函數

編輯

n次試驗中有k次成功的機率可以寫為以下總和[1]

 

其中 是 {1,2,3,..., n } 的全體k元子集的集合。例如,如果n = 3,那麼   補集,也就是 

 將包含 個元素,因此上述總和在實務中是很難計算的,除非試驗次數n很小(例如,如果n = 30, 包含超過1020個元素)。然而,還有其他更有效的方法可以計算 

只要成功機率都不等於 1,就可以使用遞歸公式計算出k次成功的機率:[2][3]

 

其中

 

遞歸公式在數值上不穩定,在 約大於20時應避免使用。另一種方法是使用分治算法:假設 是2的冪,並以 表示成功概率為 的卜瓦松二項分布, 表示卷積,則 

另一種可能性是使用離散傅立葉變換[4]

 

其中  

Chen和Liu在「卜瓦松二項式和條件伯努利分布的統計應用」中描述了其他方法。 [5]

特性

編輯

均值和方差

編輯

由於卜瓦松二項式分布變數是n個獨立伯努利分布變數的總和,因此其均值和方差將是n個伯努利分布的均值和方差之和:

 
 

當平均值( )和次數(n)為定值,且所有成功機率相等時,我們會得到二項式分布,變異數此時最大。當平均值固定時,變異數的上界為具有相同均值的卜瓦松分布的變異數,該上界在n趨於無窮大時可以漸近取得。[來源請求]

卜瓦松二項式分佈的沒有簡單的公式,但熵的上限是具有相同數字參數和相同均值的二項式分佈的熵。因此,熵也不大於相同均值的卜瓦松分佈的熵。

謝普-奧爾金凹性猜想由勞倫斯·謝普英語Lawrence Shepp英格拉姆·奧爾金英語Ingram Olkin於1981年提出,指出卜瓦松二項式分佈的熵是成功機率 的凹函數。這個猜想由 Erwan Hillion 和 Oliver Johnson 於2015年證明。1981年同一篇論文亦提出謝普-奧爾金單調性猜想:若 ,則熵對 為單調遞增。這個猜想也被 Hillion 和 Johnson 於 2019 年證明。

參考資料

編輯
  1. ^ Wang, Y. H. On the number of successes in independent trials (PDF). Statistica Sinica. 1993, 3 (2): 295–312 [2023-07-29]. (原始內容存檔 (PDF)於2016-03-03). 
  2. ^ Shah, B. K. On the distribution of the sum of independent integer valued random variables. American Statistician. 1994, 27 (3): 123–124. JSTOR 2683639. 
  3. ^ Chen, X. H.; A. P. Dempster; J. S. Liu. Weighted finite population sampling to maximize entropy (PDF). Biometrika. 1994, 81 (3): 457 [2023-07-29]. doi:10.1093/biomet/81.3.457. (原始內容存檔 (PDF)於2022-01-07). 
  4. ^ Fernandez, M.; S. Williams. Closed-Form Expression for the Poisson-Binomial Probability Density Function. IEEE Transactions on Aerospace and Electronic Systems. 2010, 46 (2): 803–817. Bibcode:2010ITAES..46..803F. S2CID 1456258. doi:10.1109/TAES.2010.5461658. 
  5. ^ Chen, S. X.; J. S. Liu. Statistical Applications of the Poisson-Binomial and conditional Bernoulli distributions. Statistica Sinica. 1997, 7: 875–892.