68–95–99.7法則

統計學法則

統計上,68–95–99.7法則(68–95–99.7 rule)是在正態分佈中,距平均值小於一個標準差、二個標準差、三個標準差以內的百分比,更精確的數字是68.27%、95.45%及99.73%。若用數學用語表示,其算式如下,其中X為正態分佈隨機變量的觀測值,μ為分佈的平均值,而σ為標準差:

正態分佈下,和平均值偏離一個標準差以內的數據會佔68.27%,偏離二個標準差以內的數據會到95.45%,偏離三個標準差以內的數據會到99.73%。
x軸為標準分數,y軸是比標準分數接近平均值之內的比例。y軸是對數長度

在實驗科學中有對應正態分佈的三西格馬法則(three-sigma rule of thumb),是一個簡單的推論,內容是「幾乎所有」的值都在平均值正負三個標準差的範圍內,也就是在實驗上可以將99.7%的概率視為「幾乎一定」[1]。不過上述推論是否有效,會視探討領域中「顯著」的定義而定,在不同領域,「顯著」(significant)的定義也隨着不同,例如在社會科學中,若置信區間是在正負二個標準差(95%)的範圍,即可視為顯著。但是在粒子物理中,若是發現英語Discovery (observation)新的粒子,置信區間要到正負五個標準差(99.99994%)的程度。

在不是正態分佈的情形下,也有另一個對應的三西格馬法則(three-sigma rule),即使是在非正態分佈的情形下,至少會有88.8%的概率會在正負三個標準差的範圍內,這是依照柴比雪夫不等式的結果。若是單模分佈(unimodal distributions)下,正負三個標準差內的概率至少有95%,若一些符合特定條件的分佈,概率至少會到98%[2]

數值表

編輯

由於正態分佈含有指數項的特性,超出某個標準差範圍的概率會隨着該範圍的擴大而大幅減小。假如某實驗每天進行一次,則實驗結果超出某標準差範圍的頻率可列為下表:

範圍 預期的樣本比例在範圍內 近似預期頻率超出範圍 近似頻率(假設每天實驗一次)
μ ± 0.5σ 0.382924922548026 3次中發生2次 每星期四至五次
μ ± σ 0.682689492137086[3] 3次中發生1次 每星期兩次
μ ± 1.5σ 0.866385597462284 7次中發生1次 每星期
μ ± 2σ 0.954499736103642[4] 22次中發生1次 每三個星期
μ ± 2.5σ 0.987580669348448 81次中發生1次 每三個月
μ ± 3σ 0.997300203936740[5] 370次中發生1次 每年
μ ± 3.5σ 0.999534741841929 2 149次中發生1次 每六年
μ ± 4σ 0.999936657516334 15 787次中發生1次 每43 年(約一生兩次)
μ ± 4.5σ 0.999993204653751 147160次中發生1次 每403 年(近代以來僅1次)
μ ± 5σ 0.999999426696856 1744278次中發生1次 4776年(人類記錄歷史以來僅1次)
μ ± 5.5σ 0.999999962020875 26330254次中發生1次 72090年(智人出現以來僅4次)
μ ± 6σ 0.999999998026825 506797346次中發生1次 每138萬年(直立人出現以來僅1-2次)
μ ± 6.5σ 0.999999999919680 12450197393次中發生1次 每3400萬年(恐龍滅絕以來僅2次)
μ ± 7σ 0.999999999997440 390682215445次中發生1次 每10.7億年(地球誕生以來僅4次)
μ ± xσ    次中發生1次  

參考文獻

編輯
  1. ^ 「三西格馬法則」的用法大約是在公元2000年代時出現,有刊載在Schaum's Outline of Business Statistics. McGraw Hill Professional. 2003: 359 Grafarend, Erik W. Linear and Nonlinear Models: Fixed Effects, Random Effects, and Mixed Models. Walter de Gruyter. 2006: 553. 
  2. ^ See:
  3. ^ Sloane, N.J.A. (編). Sequence A178647. The On-Line Encyclopedia of Integer Sequences. OEIS Foundation. 
  4. ^ Sloane, N.J.A. (編). Sequence A110894. The On-Line Encyclopedia of Integer Sequences. OEIS Foundation. 
  5. ^ Sloane, N.J.A. (編). Sequence A270712. The On-Line Encyclopedia of Integer Sequences. OEIS Foundation. 

參見

編輯