68–95–99.7法则

統計學法則

统计上,68–95–99.7法则(68–95–99.7 rule)是在正态分布中,距平均值小于一个标准差、二个标准差、三个标准差以内的百分比,更精确的数字是68.27%、95.45%及99.73%。若用数学用语表示,其算式如下,其中X为正态分布随机变量的观测值,μ为分布的平均值,而σ为标准差:

正态分布下,和平均值偏离一个标准差以内的数据会占68.27%,偏离二个标准差以内的数据会到95.45%,偏离三个标准差以内的数据会到99.73%。
x轴为标准分数,y轴是比标准分数接近平均值之内的比例。y轴是对数长度

在实验科学中有对应正态分布的三西格马法则(three-sigma rule of thumb),是一个简单的推论,内容是“几乎所有”的值都在平均值正负三个标准差的范围内,也就是在实验上可以将99.7%的概率视为“几乎一定”[1]。不过上述推论是否有效,会视探讨领域中“显著”的定义而定,在不同领域,“显著”(significant)的定义也随着不同,例如在社会科学中,若置信区间是在正负二个标准差(95%)的范围,即可视为显著。但是在粒子物理中,若是发现英语Discovery (observation)新的粒子,置信区间要到正负五个标准差(99.99994%)的程度。

在不是正态分布的情形下,也有另一个对应的三西格马法则(three-sigma rule),即使是在非正态分布的情形下,至少会有88.8%的概率会在正负三个标准差的范围内,这是依照切比雪夫不等式的结果。若是单模分布(unimodal distributions)下,正负三个标准差内的概率至少有95%,若一些符合特定条件的分布,概率至少会到98%[2]

数值表

编辑

由于正态分布含有指数项的特性,超出某个标准差范围的概率会随着该范围的扩大而大幅减小。假如某实验每天进行一次,则实验结果超出某标准差范围的频率可列为下表:

范围 范围内样本的预期比例 范围外样本的预期比例(近似) 若每天实验一次,范围外样本的发生频率
μ ± 0.5σ 0.382924922548026 3/5 每周4-5次
μ ± σ 0.682689492137086[3] 1/3 每周2次
μ ± 1.5σ 0.866385597462284 2/15 每1周
μ ± 2σ 0.954499736103642[4] 1/22 每3周
μ ± 2.5σ 0.987580669348448 1/81 每3个月
μ ± 3σ 0.997300203936740[5] 1/370 每1年
μ ± 3.5σ 0.999534741841929 1/2149 每6年
μ ± 4σ 0.999936657516334 1/15787 每43年(约一生两次)
μ ± 4.5σ 0.999993204653751 1/147160 每403年(近代以来仅1次)
μ ± 5σ 0.999999426696856 1/1744278 4776人类记录历史以来仅1次)
μ ± 5.5σ 0.999999962020875 1/26330254 72090智人出现以来仅4次)
μ ± 6σ 0.999999998026825 1/506797346 每138万年直立人出现以来仅1-2次)
μ ± 6.5σ 0.999999999919680 1/12450197393 每3400万年(恐龙灭绝以来仅2次)
μ ± 7σ 0.999999999997440 1/390682215445 每10.7亿年(地球诞生以来仅4次)
μ ± xσ      


参考文献

编辑
  1. ^ “三西格马法则”的用法大约是在公元2000年代时出现,有刊载在Schaum's Outline of Business Statistics. McGraw Hill Professional. 2003: 359 Grafarend, Erik W. Linear and Nonlinear Models: Fixed Effects, Random Effects, and Mixed Models. Walter de Gruyter. 2006: 553. 
  2. ^ See:
  3. ^ Sloane, N.J.A. (编). Sequence A178647. The On-Line Encyclopedia of Integer Sequences. OEIS Foundation. 
  4. ^ Sloane, N.J.A. (编). Sequence A110894. The On-Line Encyclopedia of Integer Sequences. OEIS Foundation. 
  5. ^ Sloane, N.J.A. (编). Sequence A270712. The On-Line Encyclopedia of Integer Sequences. OEIS Foundation. 

参见

编辑