拓扑数据分析

拓扑数据分析Topological Data Analysis ;缩写作TDA),是应用数学当中一门在数据集的分析用上了拓扑学的新技术领域,主要用于数据挖掘计算机视觉理论研究。要从多维度、不完整和杂讯多的数据集中提取讯息,一般也具有挑战性的。

拓扑数据分析的主要问题有:

  • 如何从低维度的表示去获得高维度的结构;
  • 如何将离散单位添加到全局结构中。

人脑可以轻易从低维度的私人数据构建整体结构。例如,从每只眼睛中的平面图像中获取物体的三维形状并不困难。公共结构的创建也通过将时间片段中的离散组合成连续图像来执行。例如,电视图像在技术上是个别点的阵列,然而,它们被认为是单个场景。

拓扑数据分析提供了一种总体框架,以对所选择的特定度量不敏感的方式分析这些数据,并提供降低维数和对噪声的鲁棒性。以下为当中的主要方法:

  • 根据接近度参数,通过一些单纯复合物系列替换一组数据元素,例如:在数据的点云中寻找出同调竹4部分。
  • 通过代数拓扑分析这些拓扑结构,特别是稳定同源性的新理论。
  • 将数据集的稳定同源性转码为参数化版本的Betti数字,以下称为条形码。