均方根偏差均方根差,英语:root-mean-square deviationRMSD)或均方根误差root-mean-square errorRMSE)是常用于衡量模型预测值或估计量(样本值或总体值)与观测值之间差异的一种指标。均方根偏差代表预测值和观察值之差的二阶样本的平方根(样本标准差),或该差值的平方平均数。当这些离差是以用来计算估计量的数据样本本身来计算时,通常称差值为残差residual);当差值不基于样本得出的估计量时,通常称为误差(error)或预测误差(prediction errors)。均方根误差主要作用是将各个数据点的预测的误差大小汇总为一个预测力的度量。均方根误差是精度的度量,用于比较特定数据集的不同模型的预测误差,但不能比较数据集之间的预测误差,因为它是尺度依赖的。[1]

均方根误差总是非负的,值为0(实际极少出现)的情况表示与数据完全吻合。一般而言,低RMSD比高RMSD要好。然而,在不同类型的数据之间进行比较是无意义的,因为度量取决于所使用的数字的尺度。

均方根误差是平方误差平均值的平方根。各个误差对均方根误差的影响与平方误差的大小成正比;因此,较大的误差对均方根误差有不成比例的大影响。因此,均方根误差对离群值很敏感。[2][3]

公式

编辑

估计量 相对于被估计参数 的均方根误差的定义是均方误差的平方根:

 

对于一个无偏估计量(unbiased estimator),均方根差是变异数的平方根,即标准差

回归分析中,时间为t应变数 的回归预测值 在观察次数为T时的均方根差,可以作为T次不同的预测,计算方式为离差平方的均值的平方根:

 

(对于横截面数据回归,下标ti取代,Tn取代。)

在某些情况下,均方根差被用来比较两个事物之间的不同(可能没有哪个被视为“标准”)。例如,在量度两个时间序列  的平均偏差时,均方根偏差的式子会变成

 

正规化均方根误差

编辑

将均方根误差正规化,可以使不同数值范围的资料集之间更易于比较。虽然目前并没有一个一致的方法来正规化均方根差,但较常用平均值或是极差(最大和最少值之差)来正规化被量测的资料。

  .

这个值常称为正规化均方根偏差(NRMSD)或正规化均方根误差(NRMSE),常以百分比形式表示。比例的值较低时代表残差变异数较小。在很多情况下,特别是取较小的样本的时候,样本的范围容易被样本的大小影响,其准确度可能就受到影响。

另一种使均方根误差能用于横向比较的方法是将其除以四分位距。用四分位距来除均方根误差,得到的正规化数值对目标变量中的极端值不那么敏感。

 ,其中 

  ,其中“−1”为分位函数

当以量测值的平均值来正规化时,可使用术语“均方根误差变异系数”来避免歧义,记作CV(RMSD)。[4]它的计算方式和变异系数相似,但是以均方根差取代标准差:

 

应用

编辑
  • 气象学上,可用来评估一个数值模型可以多好地预测大气层的行为。
  • 生物资讯学中,均方根差被用来量测重叠蛋白质(superimposed proteins)分子间的距离。
  • 在结构药物设计中,均方根差被用来测量配体(ligand)的晶格构造以及对接预测(docking prediction)。
  • 经济学中,均方根差被用来确定一个模型是否吻合经济指标。部分专家曾提出均方根差不如相对绝对误差(relative absolute error)可靠。[5]
  • 在实验心理学中,分均根差被用来指示一个数学或计算行为模型(mathematical or computational models)能解释实际观察行为的良好程度。
  • 地理信息系统(GIS)中,均方根误差是一种用来评价空间分析遥感精度的量度。
  • 水文地质学中,均方根差和正规化均方根差被用来评估地下水模型校正。[6]
  • 在影像科学中,均方根差是一种峰值信噪比,是一种用来评价一个方法相对原始图像能多好地重建原来的图像的方法。
  • 计算神经科学中,均方根差被用来检视一个系统能学习一个给定模型的能力。[7]
  • 蛋白质核磁共振光谱学中,均方根差被用来当作一个评估结构品质的量度。

参见

编辑

参考文献

编辑
  1. ^ Hyndman, Rob J.; Koehler, Anne B. Another look at measures of forecast accuracy. International Journal of Forecasting. 2006, 22 (4): 679–688. CiteSeerX 10.1.1.154.9771 . doi:10.1016/j.ijforecast.2006.03.001. 
  2. ^ Pontius, Robert; Thontteh, Olufunmilayo; Chen, Hao. Components of information for multiple resolution comparison between maps that share a real variable. Environmental Ecological Statistics. 2008, 15 (2): 111–142. doi:10.1007/s10651-007-0043-y. 
  3. ^ Willmott, Cort; Matsuura, Kenji. On the use of dimensioned measures of error to evaluate the performance of spatial interpolators. International Journal of Geographical Information Science. 2006, 20: 89–102. doi:10.1080/13658810500286976. 
  4. ^ FAQ: What is the coefficient of variation?. [19 February 2019]. (原始内容存档于2021-12-16). 
  5. ^ Armstrong, J. Scott; Collopy, Fred. Error Measures For Generalizing About Forecasting Methods: Empirical Comparisons (PDF). International Journal of Forecasting. 1992, 8 (1): 69–80 [2022-06-16]. CiteSeerX 10.1.1.423.508 . doi:10.1016/0169-2070(92)90008-w. (原始内容存档 (PDF)于2021-07-06). 
  6. ^ Anderson, M.P.; Woessner, W.W. Applied Groundwater Modeling: Simulation of Flow and Advective Transport 2nd. Academic Press. 1992. 
  7. ^ Ensemble Neural Network Model. [2022-06-16]. (原始内容存档于2021-09-21).