余弦相似度 皮尔逊 斯皮尔曼
时间: 2023-07-27 10:06:51 浏览: 181
相似度一些总结
余弦相似度、皮尔逊相关系数和斯皮尔曼相关系数都是用于衡量两个向量或数据集之间的相似性或相关性的统计指标。
1. 余弦相似度(Cosine Similarity)是通过计算两个向量之间的夹角来衡量它们的相似程度。它通常用于文本相似性计算、推荐系统等领域。余弦相似度的取值范围在-1到1之间,值越接近1表示两个向量越相似。
2. 皮尔逊相关系数(Pearson Correlation Coefficient)用于衡量两个连续型变量之间的线性相关程度。它考虑了变量之间的线性关系,取值范围在-1到1之间,值为1表示完全正相关,值为-1表示完全负相关,值为0表示无关。
3. 斯皮尔曼相关系数(Spearman's Rank Correlation Coefficient)也用于衡量两个变量之间的相关程度,但不要求变量是连续型的。它基于变量的等级或顺序,而不是具体的数值。斯皮尔曼相关系数的取值范围在-1到1之间,与皮尔逊相关系数类似。
这些统计指标在数据分析、机器学习等领域中都有广泛的应用,可以帮助我们理解和分析数据之间的关系。
阅读全文