統計圖形,又稱為統計圖統計學圖形圖解方法圖解技術圖解分析方法圖解分析技術,是指統計學領域當中用於可視化定量數據信息圖形。有時,人們也把統計圖形與各種統計學表格統稱為統計圖表統計學圖表

概述

編輯
 
安德森鳶尾花卉數據集雙標圖

統計學數據分析過程可大致分為兩個組成部分:定量分析方法(Quantitative techniques)和圖解分析方法(graphical techniques)。定量分析方法是指那套產生數值型或表格型輸出的統計學操作程序;比如,包括假設檢驗方差分析點估計信賴區間以及最小二乘法回歸分析。這些手段以及與此類似的其他技術方法全都頗具價值,屬於是經典分析方面的主流[1]

另一方面,還有一大套我們一般稱之為圖解分析方法的統計學工具。這些工具包括散點圖直方圖概率圖英語probability plot殘差圖英語residual plotresidual plot)、箱形圖塊圖英語block plot以及雙標圖探索性數據分析Exploratory data analysis,EDA)就密切地依賴於這些手段以及與此類似的其他技術方法。圖解分析操作程序不僅僅是在EDA背景下才使用的工具;在檢驗假設、模型選擇統計模型驗證英語统计模型验证、估計量(estimator)選擇、關係確定、因素效應判定以及離群值英語outlier檢出方面,此類圖解分析工具還可以作為最佳捷徑,用來深入認識數據集。此外,優質的統計圖形還可以作為一種令人信服的溝通手段,用來向他人傳達存在於數據之中的基本訊息[1]

圖解式統計學方法具有四個方面的目標[2]:⑴ 探究數據集的內容;⑵ 用於發現數據之中的結構;⑶ 檢查統計學模型之中的假設;⑷ 溝通傳達分析結果。

如果不採用統計圖形,也就會喪失深入認識數據基礎結構之一個或多個方面的機會。

歷史

編輯
 
三維餅圖示例:歐盟各國擁有歐盟農田的百分比

統計圖形的起源可以追溯到人們最早試圖分析數據的活動,而如今這種技術方法已經成為科學發展的關鍵手段之一。早在十八世紀,人們就採用了許多為我們當前所熟悉的統計製圖手段和形式,如二維地圖英語Bivariate map示意地圖條圖以及坐標紙。人們對於下列四個問題的關注推動了統計圖形技術方法的發展[3]

  • 十七世紀和十八世紀期間的空間組織問題
  • 十八世紀期間和十九世紀早期的離散比較問題
  • 十九世紀期間的連續分布問題
  • 十九世紀和二十世紀期間的多變量分布與相關問題

自1970年代以來,隨着計算機圖形學及其相關技術方法的復興,統計圖形目前已經東山再起,再度成為一種重要的分析工具。

示例

編輯
 
法國工程師查爾斯·約瑟夫·密納德於1861年繪製的關於拿破崙入侵俄國信息圖形

下列人物是一些著名統計圖形的設計者:

參見

編輯
 
美國華盛頓州20號州道英語Washington State Route 20首次開放/最終關閉日期的概率圖英語Probability plot[4]

參考文獻

編輯
  1. ^ 1.0 1.1 (英文) 原文引自屬於美國政府機構的國家標準與技術研究院公有領域出版物。
  2. ^ (英文)William G. Jacoby (1997). Statistical Graphics for Univariate and Bivariate Data: Statistical Graphics pp.2–4
  3. ^ (英文)James R. Beniger and Dorothy L. Robyn (1978). "Quantitative graphics in statistics: A brief history". In: The American Statistician. 32: pp. 1–11.
  4. ^ (英文)SR 20 - North Cascades Highway - Opening and Closing History. North Cascades Passes. Washington State Department of Transportation. 2009年10月 [2009-02-08]. (原始內容存檔於2009-02-18). 

延伸閱讀

編輯

外部連結

編輯