大数据的几何和拓扑处理
资料介绍:
大数据的几何和拓扑处理(中文13000字,英文PDF)
关键字:
大数据,工业 4.0,拓扑数据分析,持久同调,降维,大数据可视化。
摘要
现代数据科学使用拓扑方法来寻找数据集的结构特征,然后再进一步监督的或非监督的分析。几何和拓扑学是分析大规模几何以来的数据量可以看作是距离函数的研究。数学形式主义是为了结合几何和拓扑技术而发展起来的带有点云数据集,即有限的点集。然后从不同的分支调整工具研究点云数据集的几何和拓扑学。点云是有限的样本从几何物体上取下的,也许带有噪音。拓学为定性提供了一种形式语言数学,而几何主要是定量的。因此,在拓扑学中,我们研究了接近或接近,不使用距离。拓扑空间之间的映射称为连续的,如果它保存了近度结构。几何和拓扑方法是我们分析的工具高度复杂的数据。这些方法创建所有数据的摘要或压缩表示帮助快速发现数据中特定模式和关系的特性。建设的想法属性的整个域的摘要涉及到理解拓扑之间的关系以及利用各种特征的数据构建的几何对象。
在各种消除噪音、减少模型、重建可行性的方法中的共同线索,和盲源分离,是用更低的维度近似来代替原始数据通过矩阵或多向阵列分解或分解得到的表示。另外这些转换是特征概括或子集选择方法的重大挑战。大数据将通过关注可伸缩特性选择来考虑。低维近似值表示用于大数据可视化。 [资料来源:http://www.doc163.com]
拓扑学和大数据之间的交叉领域将带来巨大的机遇和挑战,对于大的数据社区。本调查旨在汇集最新的大数据几何和拓扑方法的研究成果。
[资料来源:www.doc163.com]
[资料来源:http://doc163.com]