热图(英语:heat map)在二维空间中以颜色的形式显示一个现象的绝对量,是一种数据可视化技术。颜色的变化可能是通过色调明度,给读者提供明显的视觉提示,说明现象是如何在空间上聚集或变化的。热图有两种完全不同的类别:聚集热图和空间热图。在聚集热图中,幅度被排列成一个固定单元格大小的矩阵,其行和列是离散的现象和类别,行和列的排序是有意的,而且有些随意,目的是暗示聚集或描绘出通过统计分析发现的聚集。单元格的大小是任意的,但足够大,可以清晰可见。相比之下,空间热图中某一量级的位置是由该量级在该空间中的位置所决定的,没有单元的概念,现象被认为是连续变化的。

使用透过DNA微数组生成的热图呈现出基因表达
无人机探测系统射频覆盖范围的热图

虽然“热图”是一个新兴的词汇,但是用明暗的矩阵来标示元素的方法已经有超过一世纪的历史了。[1]

历史

编辑

热图起源于数据矩阵中数值的二维显示。较大的数值用深灰色或黑色的方格(像素)呈现,较小的数值用较浅的方格表示。Loua (1873)使用明暗矩阵来可视化巴黎各区的社会统计数据。[1] Sneath (1957)通过将矩阵的行和列进行换位,将相似的数值按照聚类的方式放在彼此附近,来显示聚类分析的结果。Jacques Bertin使用类似的表示方法来显示符合累积量表的数据。将聚类树连接到数据矩阵的行和列的想法起源于1973年的Robert Ling。Ling使用打印机上的字符来表示不同的灰度,每个像素一个字符宽度。Leland Wilkinson在1994年开发了第一个用高分辨率彩色图形绘制聚集热图的计算机程序(SYSTAT)。

软件设计师Cormac Kinney在1991年注册了“热图”一词的商标,用来描述描述金融市场信息的二维显示。[2] 2003年收购Kinney发明的公司无意中让该商标失效。[3]

类型

编辑
 
根据对飞机可能飞行路径的贝叶斯法分析,在彩色水深图上显示失踪的马航370航班的可能位置的热图。[4]

热图有不同的种类:

  • 生物学热图在分子生物学中通常用于表示从DNA微数组中获得的许多基因在一些可比样本(如不同状态的细胞、不同患者的样本)中的表达水平。
  • 树图是数据的二维层次划分,在视觉上类似于热图。
  • 拼贴图英语Mosaic plotMosaic plot)是表示双向或多向数据表的平铺热图。与树图一样,拼贴图中的矩形区域是分层组织的。这意味着这些区域是矩形而不是正方形。Friendly (1994)调查了该图的历史和使用情况。
  • 密度函数可视化是一种用于表示地图中点的密度的热图。它使人们能够感知点的密度,而不受缩放系数的影响。Perrot et al. (2015)提出了一种使用密度函数的方法,利用Spark和Hadoop的大数据基础设施来可视化数十亿和数十亿的点。[5]

配色

编辑

可以使用许多不同的配色方案来说明热图,每种方案都有感知上的优势和劣势。彩虹色彩映射经常被使用,因为相比于灰度的差异,人类更容易感知色彩的明暗,据称这将增加图像中可感知的细节数量。然而,科学界的许多人并不鼓励这样做,原因如下:[6][7][8][9][10][11]

  • 这些颜色缺乏在灰度黑体光谱彩色图中发现的自然感知排序。[6][11]
  • 常见的色彩映射(如许多可视化软件包中默认的“jet”色彩映射)在亮度方面的变化不受控制,这使得在显示或印刷时无法有意义地转换为灰度。这也会分散对实际数据的注意力,使黄色和青色区域看起来比实际最重要的数据区域更突出。[6][11]
  • 颜色之间的变化也会导致人们感知到实际并不存在的渐变,使实际的渐变不那么突出,这意味着彩虹色图在很多情况下实际上会掩盖细节,而不是增强细节。[6][10][11]
  • 彩虹色彩映射中并不是所有的颜色都能被色觉障碍的读者区分,这使得相当一部分人无法使用这些颜色方案的图表。[11]

等值区域图与热图的对比

编辑

等值区域图有时被误称为热图。等值区域图的特点是在地理边界内有不同的阴影或图案,以显示感兴趣的变量的比例,而热图(在地图上)的颜色变化与地理边界并不能对应上。[12]

软件实现

编辑

有几种热图软件可免费使用:

例子

编辑

参见

编辑

参考文献

编辑
  1. ^ 1.0 1.1 Wilkinson L, Friendly M. The History of the Cluster Heat Map. The American Statistician. May 2009, 63 (2): 179–184. CiteSeerX 10.1.1.165.7924 . S2CID 122792460. doi:10.1198/tas.2009.0033. 
  2. ^ United States Patent and Trademark Office, registration #75263259. 1993-09-01 [2019-08-14]. (原始内容存档于2013-05-11). 
  3. ^ Silhavy R, Senkerik R, Oplatkova ZK, Silhavy P, Prokopova Z. Software Engineering Perspectives and Application in Intelligent Systems. 2016-04-26 [2019-08-14]. ISBN 978-3-319-33622-0. (原始内容存档于2021-01-20). 
  4. ^ MH370 – Definition of Underwater Search Areas (PDF) (报告). Australian Transport Safety Bureau. 3 December 2015 [2021-04-04]. (原始内容存档 (PDF)于2021-04-12). 
  5. ^ Perrot A, Bourqui R, Hanusse N, Lalanne F, Auber D. Large interactive visualization of density functions on big data infrastructure (PDF). 2015 IEEE 5th Symposium on Large Data Analysis and Visualization (LDAV). 2015: 99–106 [2021-04-04]. ISBN 978-1-4673-8517-6. S2CID 4768931. doi:10.1109/LDAV.2015.7348077. (原始内容存档 (PDF)于2019-05-03) (英语).  |journal=被忽略 (帮助)
  6. ^ 6.0 6.1 6.2 6.3 Borland D, Taylor MR. Rainbow color map (still) considered harmful. IEEE Computer Graphics and Applications. 2007, 27 (2): 14–7. PMID 17388198. doi:10.1109/MCG.2007.323435. 
  7. ^ How NOT to Lie with Visualization页面存档备份,存于互联网档案馆) – Bernice E. Rogowitz and Lloyd A. Treinish – IBM Thomas J. Watson Research Center, Yorktown Heights, NY
  8. ^ Harrower M, Brewer CA. ColorBrewer.org: An Online Tool for Selecting Colour Schemes for Maps. Dodge M, Kitchin R, Perkins C (编). The Cartographic Journal. 2003: 27–37. ISBN 978-0-470-98007-1. S2CID 140173239. doi:10.1179/000870403235002042. 
  9. ^ Green DA. A colour scheme for the display of astronomical intensity images. Bulletin of the Astronomical Society of India. 2011, 39: 289–95. Bibcode:2011BASI...39..289G. arXiv:1108.5083 . 
  10. ^ 10.0 10.1 Borkin MA, Gajos KZ, Peters A, Mitsouras D, Melchionna S, Rybicki FJ, et al. Evaluation of artery visualizations for heart disease diagnosis. IEEE Transactions on Visualization and Computer Graphics. December 2011, 17 (12): 2479–88. CiteSeerX 10.1.1.309.590 . PMID 22034369. S2CID 2548700. doi:10.1109/TVCG.2011.192. 
  11. ^ 11.0 11.1 11.2 11.3 11.4 Crameri F, Shephard GE, Heron PJ. The misuse of colour in science communication. Nature Communications. October 2020, 11 (1): 5444 [2021-04-04]. PMC 7595127 . PMID 33116149. doi:10.1038/s41467-020-19160-7. (原始内容存档于2021-01-27). 
  12. ^ Choropleth vs. Heat Map –. gretchenpeterson.com. [2021-04-04]. (原始内容存档于2020-08-19). 
  13. ^ Using R to draw a heat map from Microarray Data. Molecular Organisation and Assembly in Cells. 26 Nov 2009 [2021-04-04]. (原始内容存档于2010-04-30). 
  14. ^ Draw a Heat Map. R Manual. [2021-04-04]. (原始内容存档于2020-04-18). 
  15. ^ Galili T, O'Callaghan A, Sidi J, Sievert C. heatmaply: an R package for creating interactive cluster heatmaps for online publishing. Bioinformatics. May 2018, 34 (9): 1600–1602. PMC 5925766 . PMID 29069305. doi:10.1093/bioinformatics/btx657. 
  16. ^ Gnuplot demo script: Heatmaps.dem. [2021-04-04]. (原始内容存档于2017-11-07). 
  17. ^ Fusion Tables Help - Create a heat map. Jan 2018 [2021-04-04]. (原始内容存档于2019-11-16).  support.google.com
  18. ^ Dave Green's 'cubehelix' colour scheme. [2021-04-04]. (原始内容存档于2021-04-14). 
  19. ^ ol/layer/Heatmap~Heatmap. OpenLayers. [2019-01-01]. (原始内容存档于2020-04-18). 
  20. ^ Heatmap. D3.js Graph Gallery. [25 July 2020]. (原始内容存档于2021-03-09). 
  21. ^ Most basic heatmap in d3.js. D3.js Graph Gallery. [25 July 2020]. (原始内容存档于2020-07-25). 
  22. ^ Heat Map Chart. AnyChart Documentation. [25 July 2020]. (原始内容存档于2020-11-29). 
  23. ^ Heat Map Charts - Gallery. AnyChart Gallery. [25 July 2020]. (原始内容存档于2019-12-09). 
  24. ^ Heatmap - Highcharts docs. Highcharts. [9 December 2019]. (原始内容存档于2020-11-12). 
  25. ^ Heat and tree maps - Highcharts demos. Highcharts. [9 December 2019]. (原始内容存档于2021-04-01). 
  26. ^ Heatmap chart - Qlik Sense on Windows. Qlik. [25 July 2020]. (原始内容存档于2020-07-25). 
  27. ^ Create heatmap chart. MATLAB. [25 July 2020]. (原始内容存档于2021-01-20). 
  28. ^ Heatmap Examples. MATLAB. [25 July 2020]. (原始内容存档于2020-07-25). 

延伸阅读

编辑

外部链接

编辑