可视化(UMAP/TSNE)
时间: 2024-10-18 20:11:22 浏览: 31
TSNE-UMAP-Embedding-Visualisation:一种简单易用的可视化嵌入方式!
可视化(Uniform Manifold Approximation and Projection for Dimension Reduction,简称UMAP;t-distributed Stochastic Neighbor Embedding,简称TSNE)是一种常用的数据降维和可视化工具,尤其适用于高维数据集的可视化呈现。
UMAP(Uniform Manifold Approximation and Projections)算法基于非局部相似度概念,旨在保持高维空间中数据点之间的全局结构,同时尽量减少低维嵌入中的离散度,生成的地图通常更为连贯和易于解读。
TSNE (t-distributed Stochastic Neighbor Embedding) 则是一种统计学方法,它将高维数据映射到二维或三维空间,使得邻近的数据点在新的空间中依然保持邻近,而远距离的数据点分离明显。TSNE的特点在于它的概率分布假设,即数据点之间的相似度由其高斯分布的密度决定,这使得它能较好地捕捉数据的复杂结构。
两者都是为了帮助研究人员直观地观察数据的聚类结构、模式和潜在的关系,常用于探索性数据分析和初步的数据理解。在许多科学领域,如生物学、计算机视觉和机器学习中,都广泛使用UMAP和TSNE来进行数据可视化展示。
阅读全文