資料視覺化
資料視覺化(英語:data visualization)被許多學科視為與視覺傳達含義相同的現代概念。它涉及到資料的視覺化表示的建立和研究。[1]
為了清晰有效地傳遞資訊,資料視覺化使用統計圖形、圖表、資訊圖表和其他工具。可以使用點、線或條對數字資料進行編碼,以便在視覺上傳達定量資訊。[2] 有效的視覺化可以幫助使用者分析和推理資料和證據。它使複雜的資料更容易理解和使用。使用者可能有特定的分析任務(如進行比較或理解因果關係),以及該任務要遵循的圖形設計原則。表格通常用於使用者尋找特定的度量,而各種類型的圖表用於顯示一個或多個變數的資料中的模式或關係。
資料視覺化既是一門藝術也是一門科學。[3] 有些人認為它是描述統計學的一個分支,但也有些人認為它是一個紮根理論開發工具。網際網路活動產生的資料量的增加和環境中感測器數量的增加被稱為"巨量資料"或物聯網。處理、分析和交流這些資料對資料視覺化來說是道德和分析方面的挑戰。[4] 資料科學領域和被稱為資料科學家的從業人員可以幫助應對這一挑戰。[5]
概述
編輯資料視覺化主要旨在藉助於圖形化手段,清晰有效地傳達與溝通訊息。但是,這並不就意味著,資料視覺化就一定因為要實現其功能用途而令人感到枯燥乏味,或者是為了看上去絢麗多彩而顯得極端複雜。為了有效地傳達思想概念,美學形式與功能需要齊頭並進,通過直觀地傳達關鍵的方面與特徵,從而實現對於相當稀疏而又複雜的資料集的深入洞察。然而,設計人員往往並不能很好地把握設計與功能之間的平衡,從而創造出華而不實的資料視覺化形式,無法達到其主要目的,也就是傳達與溝通訊息[6]。
資料視覺化與資訊圖形、資訊視覺化、科學視覺化以及統計圖形密切相關。當前,在研究、教學和開發領域,資料視覺化乃是一個極為活躍而又關鍵的方面。「資料視覺化」這條術語實現了成熟的科學視覺化領域與較年輕的資訊視覺化領域的統一[7]。
歷史
編輯資料視覺化領域的起源可以追溯到1950年代初的。當時,人們利用電腦建立出了首批圖形圖表。1987年,由布魯斯·麥考梅克、湯姆斯·蒂凡提和瑪克辛·布朗所編寫的美國國家科學基金會報告《Visualization in Scientific Computing》(意為「科學計算之中的視覺化」)[8],對於這一領域產生了大幅度的促進和刺激。這份報告之中強調了新的基於電腦的視覺化技術方法的必要性。隨著電腦運算能力的迅速提升,人們建立了規模越來越大,複雜程度越來越高的數值模型,從而造就了形形色色體積龐大的數值型資料集。同時,人們不但利用醫學掃描器和顯微鏡之類的資料採集裝置產生大型的資料集,而且還利用可以儲存文字、數值和多媒體資訊的大型資料庫來收集資料。因而,就需要進階的電腦圖學技術與方法來處理和視覺化這些規模龐大的資料集[7]。
短語「Visualization in Scientific Computing」(意為「科學計算之中的視覺化」)後來變成了「Scientific Visualization」(即「科學視覺化」),而前者最初指的是作為科學計算之組成部分的視覺化:也就是科學與工程實踐當中對於電腦建模和類比的運用。更近一些的時候,視覺化也日益尤為關注資料,包括那些來自商業、財務、行政管理、數位媒體等方面的大型異質性資料集合。1990年代初,人們發起了一個新的,稱為「資訊視覺化」的研究領域,旨在為許多應用領域之中對於抽象的異質性資料集的分析工作提供支援。因此,目前人們正在逐漸接受這個同時涵蓋科學視覺化與資訊視覺化領域的新生術語「資料視覺化」[7]。
自那時起,資料視覺化就是一個處於不斷演變之中的概念,其邊界在不斷地擴大;因而,最好是對其加以寬泛的定義。資料視覺化指的是技術上較為進階的技術方法,而這些技術方法允許利用圖形、圖像處理、電腦視覺以及使用者介面,通過表達、建模以及對立體、表面、屬性以及動畫的顯示,對資料加以視覺化解釋。與立體建模之類的特殊技術方法相比,資料視覺化所涵蓋的技術方法要廣泛得多[9]。
資料視覺化的適用範圍
編輯關於資料視覺化的適用範圍,目前存在著不同的劃分方法。一個常見的關注焦點就是資訊的呈現。例如,麥可·弗蘭德利(2008)提出了資料視覺化的兩個主要的組成部分:統計圖形和主題圖[1]。另外,《Data Visualization: Modern Approaches》(意為「資料視覺化:現代方法」,2007)一文則概括闡述了資料視覺化的下列主題[10]:
所有這些主題全都與圖形設計和資訊表達密切相關。
另一方面,Frits H. Post(2002)則從電腦科學的視角,將這一領域劃分為如下多個子領域[7]:
- 視覺化演算法與技術方法
- 立體視覺化
- 資訊視覺化
- 多解析度方法
- 建模技術方法
- 互動技術方法與體系架構
資料視覺化的成功應歸於其背後基本思想的完備性:依據資料及其內在模式和關係,利用電腦生成的圖像來獲得深入認識和知識。其第二個前提就是利用人類感覺系統的廣闊頻寬來操縱和解釋錯綜複雜的過程、涉及不同學科領域的資料集以及來源多樣的大型抽象資料集合的類比。這些思想和概念極其重要,對於計算科學與工程方法學以及管理活動都有著精深而又廣泛的影響。《Data Visualization: The State of the Art》(意為「資料視覺化:尖端技術水平」)一書當中重點強調了各種應用領域與它們各自所特有的問題求解視覺化技術方法之間的相互作用[7]。
相關領域
編輯資料採集
編輯資料採集(有時縮寫為DAQ或DAS),又稱為「資料取得」或「資料收集」,是指對現實世界進行採樣,以便產生可供電腦處理的資料的過程。通常,資料採集過程之中包括為了獲得所需資訊,對於訊號和波形進行採集並對它們加以處理的步驟。資料採集系統的組成元件當中包括用於將測量參數轉換成為電訊號的感測器,而這些電訊號則是由資料採集硬體來負責取得的。
資料分析
編輯資料分析是指為了提取有用資訊和形成結論而對資料加以詳細研究和概括總結的過程。資料分析與資料探勘密切相關,但資料探勘往往傾向於關注較大型的資料集,較少側重於推理,且常常採用的是最初為另外一種不同目的而採集的資料。在統計學領域,有些人將資料分析劃分為描述性統計分析、探索性資料分析以及驗證性資料分析;其中,探索性資料分析側重於在資料之中發現新的特徵,而驗證性資料分析則側重於已有假設的證實或證偽。
資料分析的類型包括:
- 探索性資料分析:是指為了形成值得假設的檢驗而對資料進行分析的一種方法,是對傳統統計學假設檢驗手段的補充。該方法由美國著名統計學家約翰·圖基命名。
- 定性資料分析:又稱為「定性資料分析」、「定性研究」或者「質性研究資料分析」,是指對諸如詞語、相片、觀察結果之類的非數值型資料(或者說資料)的分析。
資料治理
編輯資料治理涵蓋為特定組織機構之資料建立協調一致的企業級視圖(enterprise view)所需的人員、過程和技術;資料治理旨在:
- 增強決策制定過程中的一致性與信心
- 降低遭受監管罰款的風險
- 改善資料的安全性
- 最大限度地提高資料的創收潛力
- 指定資訊品質責任
資料管理
編輯資料管理,又稱為「資料資源管理」,包括所有與管理作為有價值資源的資料相關的學科領域。對於資料管理,DAMA所提出的正式定義是:「資料資源管理是指用於正確管理企業或機構整個資料生命周期需求的體系架構、政策、規範和操作程式的制定和執行過程」。這項定義相當寬泛,涵蓋了許多可能在技術上並不直接接觸低層資料管理工作(如關聯式資料庫管理)的職業。
資料探勘
編輯資料探勘是指對大量資料加以分類整理並挑選出相關資訊的過程。資料探勘通常為商業智慧型組織和金融分析師所採用;不過,在科學領域,資料探勘也越來越多地用於從現代實驗與觀察方法所產生的龐大資料集之中提取資訊。
資料探勘被描述為「從資料之中提取隱含的,先前未知的,潛在有用資訊的非凡過程」[11],以及「從大型資料集或資料庫之中提取有用資訊的科學」[12]。與企業資源規劃相關的資料探勘是指對大型交易資料集進行統計分析和邏輯分析,從中尋找可能有助於決策制定工作的模式的過程[13]。
參考文獻
編輯- ^ 1.0 1.1 Michael Friendly (2008). "Milestones in the history of thematic cartography, statistical graphics, and data visualization" (頁面存檔備份,存於網際網路檔案館).
- ^ Stephen Few-Perceptual Edge-Selecting the Right Graph for Your Message-2004 (PDF). [2019-04-28]. (原始內容存檔 (PDF)於2014-10-05).
- ^ Manuela Aparicio and Carlos J. Costa. Data visualization. Communication Design Quarterly Review. November 2014, 3 (1): 7–11. doi:10.1145/2721882.2721883.
- ^ Nikos Bikaks (2018) "Big Data Visualization Tools" Encyclopedia of Big Data Technologies, Springer 2018.
- ^ Press, Gil. A Very Short History Of Data Science. [2019-04-28]. (原始內容存檔於2017-09-11).
- ^ (英文) "Data Visualization and Infographics" (頁面存檔備份,存於網際網路檔案館) in: Graphics, Monday Inspiration, January 14th, 2008.
- ^ 7.0 7.1 7.2 7.3 7.4 (英文) Frits H. Post, Gregory M. Nielson and Georges-Pierre Bonneau (2002). Data Visualization: The State of the Art 網際網路檔案館的存檔,存檔日期2009-10-07..
- ^ (英文) Bruce H. McCormick, Thomas A. DeFanti and Maxine D. Brown (eds.) (1987). Visualization in Scientific Computing. ACM Press
- ^ (英文)Paul Reilly, S. P. Q. Rahtz (eds.) 1992. Archaeology and the Information Age: A Global Perspective. p.92.
- ^ (英文)"Data Visualization: Modern Approaches" (頁面存檔備份,存於網際網路檔案館). in: Graphics, August 2nd, 2007
- ^ (英文)W. Frawley and G. Piatetsky-Shapiro and C. Matheus. Knowledge Discovery in Databases: An Overview. AI Magazine. Fall 1992: pp. 213–228. ISSN 0738-4602.
- ^ (英文)D. Hand, H. Mannila, P. Smyth. Principles of Data Mining. MIT Press, Cambridge, MA. 2001. ISBN 0-262-08290-X.
- ^ (英文)Ellen Monk, Bret Wagner. Concepts in Enterprise Resource Planning, Second Edition. Thomson Course Technology, Boston, MA. 2006. ISBN 0-619-21663-8.
延伸閱讀
編輯- (英文)Chandrajit Bajaj, Bala Krishnamurthy (1999). 'Data Visualization Techniques.
- (英文)William S. Cleveland (1993). Visualizing Data. Hobart Press.
- (英文)William S. Cleveland (1994). The Elements of Graphing Data. Hobart Press.
- (英文)Alexander N. Gorban, Balázs Kégl and Andrey Zinovyev (2007). Principal Manifolds for Data Visualization and Dimension Reduction.
- (英文)John P. Lee and Georges G. Grinstein (eds.) (1994). Database Issues for Data Visualization: IEEE Visualization '93 Workshop, San Diego.
- (英文)Peter R. Keller and Mary Keller (1993). Visual Cues: Practical Data Visualization.
- (英文)Frits H. Post, Gregory M. Nielson and Georges-Pierre Bonneau (2002). Data Visualization: The State of the Art.
外部連結
編輯- (英文)Milestones in the History of Thematic Cartography, Statistical Graphics, and Data Visualization (頁面存檔備份,存於網際網路檔案館), An illustrated chronology of innovations by Michael Friendly and Daniel J. Denis.
- (英文)uiGarden.net - Weaving Usability and Cultures: Infographics: Being and Doing (Part I) (頁面存檔備份,存於網際網路檔案館) by Venkatesh Rajamanickam (27 November 2007).
- (英文)uiGarden.net - Weaving Usability and Cultures: Infographics: Being and Doing (Part II) (頁面存檔備份,存於網際網路檔案館) by Venkatesh Rajamanickam (27 November 2007).