欧几里得距离, 曼哈顿距离, 切比雪夫距离,闵可夫斯基距离,杰卡德距离,余弦相似度,.马氏距离,汉明距离,明可夫斯基距离
时间: 2024-11-02 15:08:41 浏览: 85
欧几里得距离(Euclidean Distance),也称为直线距离,是最常见的距离计算方法,它适用于二维或高维空间,衡量两点之间的直线长度。它是通过将各个维度差值平方相加然后开根号得到的。
曼哈顿距离(Manhattan Distance),也称城市街区距离,是对角线距离的一种简化模型,适合于网格状环境,如棋盘或城市街道布局。它只考虑了坐标轴方向上的距离。
切比雪夫距离(Chebyshev Distance),又称最大值距离,测量的是两个点在每个维度上差值的最大值,是最简单的距离度量之一,对于异常值敏感。
闵可夫斯基距离(Minkowski Distance)是一组广义的距离度量,包含了几何学中的欧几里得、曼哈顿和切比雪夫距离作为特例,当p=1时为曼哈顿距离,p=2时为欧几里得距离,p趋近于无穷大时变为切比雪夫距离。
杰卡德距离(Jaccard Distance),用于比较有限集合间的相似度,通常用于文本分析和聚类,计算两个集合交集大小除以并集大小的比例。
余弦相似度(Cosine Similarity),是一种角度度量,常用于量化两个非零向量的相似程度,特别在文档相似度和推荐系统中非常有用,因为它是通过求两个向量的夹角余弦值来评估它们的方向一致性。
马氏距离(Mahalanobis Distance),结合了样本的协方差信息,是测量样本点相对于均值的整体偏离情况,常用于多元统计中的异常检测和分类任务。
汉明距离(Hamming Distance),专用于二进制串,计算两个等长字符串对应位置上不同字符的数目。
明可夫斯基距离(Generalized Hamming Distance),是一个更广泛的概念,也是一种变体的汉明距离,但它可以处理不等长的字符串,并应用到离散数据的匹配和编码纠错等领域。
以上各种距离或相似度都有各自的适用场景,选择哪种取决于具体的任务需求。
阅读全文