图聚类中为什么要先将数据集变成距离矩阵再变成相似度矩阵
时间: 2023-11-30 08:03:34 浏览: 173
GMC.zip_GMC_基于图学习的聚类_多约束聚类_多视角聚类_矩阵相似度
5星 · 资源好评率100%
在进行图聚类时,首先需要将数据集转换成一个图的形式,其中节点表示数据集中的样本,边表示样本之间的相似度。而相似度矩阵可以作为图的邻接矩阵,因此将数据集转换成相似度矩阵是图聚类的第一步。
但是,通常情况下,我们很难直接得到样本之间的相似度。因此,需要通过计算样本之间的距离来间接地计算相似度。常见的距离有欧几里得距离、曼哈顿距离、余弦相似度等。通过将距离转换成相似度,可以更好地反映样本之间的关系,从而更准确地进行图聚类。因此,将数据集变成距离矩阵再变成相似度矩阵是图聚类中必要的步骤。
阅读全文