決定系數

在統計學中用以判斷迴歸模型的解釋力

決定系數,或稱判定系數(英語:Coefficient of determination,記為R 2),在統計學中用於度量應變量的變異中可由自變量解釋部分所佔的比例,以此來判斷迴歸模型的解釋力。[1][2][3]

決定系數示意圖 線性迴歸(右側)的效果比起平均值(左側)越好,決定系數的值就越接近於1。 藍色正方形表示線性迴歸的殘差的平方, 紅色正方形數據表示對於平均值的殘差的平方。

對於簡單線性迴歸而言,決定系數為樣本相關係數的平方。[4]當加入其他迴歸自變量後,決定系數相應地變為多重相關係數的平方。

假設一數據集包括y1,...,ynn個觀察值,相對應的模型預測值分別為f1,...,fn。定義殘差ei = yifi,平均觀察值為

於是可以得到總平方和

殘差平方和

由此,決定系數可定義為

參考文獻

編輯
  1. ^ Steel, R. G. D.; Torrie, J. H. Principles and Procedures of Statistics with Special Reference to the Biological Sciences. McGraw Hill. 1960. 
  2. ^ Glantz, Stanton A.; Slinker, B. K. Primer of Applied Regression and Analysis of Variance. McGraw-Hill. 1990. ISBN 0-07-023407-8. 
  3. ^ Draper, N. R.; Smith, H. Applied Regression Analysis. Wiley-Interscience. 1998. ISBN 0-471-17082-8. 
  4. ^ Devore, Jay L. Probability and Statistics for Engineering and the Sciences 8th. Boston, MA: Cengage Learning. 2011: 508–510. ISBN 0-538-73352-7.