格鲁布斯检验法

格拉布斯检验法Grubbs's test),有时也被称为最大归一化残差检验,是一种在统计学中用于分析异常值的方法,因发明者弗兰克·E·格拉布斯英语Frank E. Grubbs而得名[1]

定义

编辑

格拉布斯检验法基于数据服从正态分布的假设,用于检验单变量英语Univariate数据集内的离群值。因此,在使用格拉布斯检验法时,必须先检验数据的分布是否可以用正态分布进行近似[2]

格拉布斯检验法定义于如下假设之上:

H0:数据集中没有异常值;
Ha:数据集中只有一个异常值。

定义格拉布斯检验统计量为:

 

其中,  分别指代的是样本的均值标准偏差

如果采用双边检验英语two-sided test的方法,则格拉布斯检验可按照以下步骤进行:

将数据集中的 个数值由最小排列到最大,则最小值 或最大值 为可能的可疑数值。若要检验最小值是否为离群值,则可以按如下公式计算:

 

检验最大值时,则为:

 

对该双边检验,若下式成立,则在置信度 处,无偏差值的假设不成立:

 

其中, 表示t-分布中当自由度 、显著性水平为 时的上临界值。如果采用单边检验方式,则应该将显著性水平改为 

参考文献

编辑
  1. ^ Grubbs, Frank E. Sample criteria for testing outlying observations. Annals of Mathematical Statistics英语Annals of Mathematical Statistics. 1950, 21 (1): 27–58. doi:10.1214/aoms/1177729885. 
  2. ^ 1.3.5.17 Detection of Outliers. NIST/SEMATECH e-Handbook of Statistical Methods. NIST. 2012 [2019-03-09]. (原始内容存档于2019-06-19). 

参见

编辑

延伸阅读

编辑