卡方分布

機率分布

卡方分布(英語:chi-square distribution[2], χ²-distribution,或寫作χ²分布)是機率論統計學中常用的一種機率分布。k個獨立的標準常態分布變量的平方和服從自由度為k的卡方分布。卡方分布是一種特殊的伽瑪分布,是統計推論中應用最為廣泛的機率分布之一,例如假說檢定信賴區間的計算。

卡方分布
機率密度函數
累積分布函數
母數 自由度
值域
機率密度函數
累積分布函數
期望值
中位數
眾數 max{ k − 2, 0 }
變異數
偏度
峰度
動差母函數
特徵函數 [1]

由卡方分布延伸出來皮爾森卡方檢定常用於:

  1. 樣本某性質的比例分布與母體理論分布的適配度(例如某行政機關男女比是否符合該機關所在城鎮的男女比);
  2. 同一母體的兩個隨機變數是否獨立(例如人的身高與交通違規的關聯性);
  3. 二或多個母體同一屬性的同質性檢定(義大利麵店和壽司店的營業額有沒有差距)。(詳見皮爾森卡方檢定

數學定義

編輯

k個隨機變數 、……、 是相互獨立且符合標準常態分布隨機變數數學期望值為0、變異數為1),則隨機變數Z的平方和

 

被稱為服從自由度k卡方分布,記作

 
 

性質

編輯

可以在文章右上角的表中看到更多卡方分布的性質。

機率密度函數

編輯

卡方分布的機率密度函數為:

 

其中 ,當  。這裡Γ代表Gamma函數

累積分布函數

編輯

卡方分布的累積分布函數為:

 

其中γ(k,z)為不完全Γ函數

在大多數涉及卡方分布的書中都會提供它的累積分布函數的對照表。此外許多表格計算軟體如OpenOffice.org Calc和Microsoft Excel中都包括卡方分布函數。

自由度為k的卡方變量的平均值k變異數2k。 卡方分布是伽瑪分布的一個特例,它的為:

 

其中 雙伽瑪函數

卡方變數與Gamma變數的關系

編輯

當Gamma變數 頻率(λ)為1/2時,α的2倍為卡方變數之自由度。 即:

 
 
 

卡方變數之期望值=自由度 卡方變數之變異數=兩倍自由度

可加性

編輯

由定義可得,獨立卡方變量之和同樣服從卡方分布。特別地,若 分別獨立服從自由度為 的卡方分布,那麼它們的和 服從自由度為 的卡方分布。

偏差的平方和

編輯

k個隨機變數 、……、 是相互獨立,符合標準常態分布隨機變數,則它們與均值之間偏差的平方和

 

其中均值

 

它的平方正比於自由度為1的卡方分布,即

 

卡方分布表

編輯

p-value = 1- p_CDF.

χ2越大,p-value越小,則可信度越高。通常用p=0.05作為閾值,即95%的可信度。

常用的χ2與p-value表如下:

自由度k \ P value (機率) 0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001
1
0.004 0.02 0.06 0.15 0.46 1.07 1.64 2.71 3.84 6.64 10.83
2
0.10 0.21 0.45 0.71 1.39 2.41 3.22 4.60 5.99 9.21 13.82
3
0.35 0.58 1.01 1.42 2.37 3.66 4.64 6.25 7.82 11.34 16.27
4
0.71 1.06 1.65 2.20 3.36 4.88 5.99 7.78 9.49 13.28 18.47
5
1.14 1.61 2.34 3.00 4.35 6.06 7.29 9.24 11.07 15.09 20.52
6
1.63 2.20 3.07 3.83 5.35 7.23 8.56 10.64 12.59 16.81 22.46
7
2.17 2.83 3.82 4.67 6.35 8.38 9.80 12.02 14.07 18.48 24.32
8
2.73 3.49 4.59 5.53 7.34 9.52 11.03 13.36 15.51 20.09 26.12
9
3.32 4.17 5.38 6.39 8.34 10.66 12.24 14.68 16.92 21.67 27.88
10
3.94 4.86 6.18 7.27 9.34 11.78 13.44 15.99 18.31 23.21 29.59

參考文獻

編輯
  1. ^ M.A. Sanders. Characteristic function of the central chi-squared distribution (PDF). [2009-03-06]. (原始內容 (PDF)存檔於2011-07-15). 
  2. ^ chi 的讀音是 /kaɪ/ ,與「開」字的國語發音相同。

外部連結

編輯