修正余弦可处理的数据类型比皮尔逊系数多吗
时间: 2023-07-14 14:13:22 浏览: 71
Python 余弦相似度与皮尔逊相关系数 计算实例
修正余弦和皮尔逊系数都可以处理数值型数据,但是在处理文本数据时,修正余弦距离更常用一些。这是因为修正余弦距离不受文本长度的影响,在计算文本相似度时更为准确。而皮尔逊系数对于数据的分布和偏移会产生较大影响,因此在处理文本数据时可能不如修正余弦距离准确。所以在处理文本数据时,修正余弦距离比皮尔逊系数更常用。
阅读全文
Python 余弦相似度与皮尔逊相关系数 计算实例