front_sim = cosine_similarity(word_vectors[pair1[1]], word_vectors[pair2[1]]) TypeError: 'ellipsis' object is not subscriptable 什么意思？怎么解决

这个错误通常意味着您正在尝试对一个不支持索引操作的对象进行索引。在这个特定的错误中，错误消息中提到了一个名为“ellipsis”的对象，这通常是由于在使用 NumPy 数组时引起的。可能的原因是您的word_vectors数组不正确，或者数组中的元素不是您预期的类型。如果您的代码中使用了省略号（“...”）来引用数组的某些部分，那么请确保该数组的维度正确，并且您正在使用 NumPy 版本1.9或更高版本。为了更好地理解问题的根本原因，请提供更多代码和上下文，以便我可以更好地帮助您解决问题。

优化这款代码def compare(): text1 = text_new text2 = text_old tf_idf_vectorizer = TfidfVectorizer() tf_idf_vectors = tf_idf_vectorizer.fit_transform([text1, text2]) cosine_similarities = cosine_similarity(tf_idf_vectors) return cosine_similarities[0, 1]增加逐一对比功能

可以将需要逐一对比的文本存储在列表中，然后使用两重循环来遍历所有文本对，计算它们之间的相似度。以下是修改后的代码示例： ``` from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.metrics.pairwise import cosine_similarity def compare(text_list): tf_idf_vectorizer = TfidfVectorizer() tf_idf_vectors = tf_idf_vectorizer.fit_transform(text_list) n = len(text_list) similarities = [] for i in range(n): for j in range(i+1, n): cosine_similarity = cosine_similarity(tf_idf_vectors[i], tf_idf_vectors[j])[0][0] similarities.append((i, j, cosine_similarity)) return similarities ``` 这个函数将返回一个列表，其中每个元素都表示一对文本之间的相似度。每个元素都是一个三元组，包含两个文本的索引和它们之间的余弦相似度。例如，如果输入列表中有三个文本，函数将返回以下类似的结果： ``` [(0, 1, 0.732), (0, 2, 0.581), (1, 2, 0.812)] ``` 这表示第一个文本和第二个文本之间的相似度为 0.732，第一个文本和第三个文本之间的相似度为 0.581，第二个文本和第三个文本之间的相似度为 0.812。

为什么这段代码def compare(text1, text2): similarities = [] text1 = ("text_new:\n", text_new) text2 = ("text_old:\n", text_old) for i in range(len(text1)): for j in range(len(text2)): tf_idf_vectorizer = TfidfVectorizer() tf_idf_vectors = tf_idf_vectorizer.fit_transform([text1[i], text2[j]]) cosine_similarities = cosine_similarity(tf_idf_vectors) similarities.append(cosine_similarities[0, 1]) print (similarities)结果不是逐一比较的结果？如何修改

这段代码中的问题在于它将两个文本列表 `text1` 和 `text2` 中的所有文本逐一进行了比较，而没有考虑它们之间的一一对应关系。因此，如果 `text1` 中有三个文本，而 `text2` 中只有两个文本，那么 `text1` 中的第三个文本将会和 `text2` 中的第一个文本进行比较，这显然是不正确的。要解决这个问题，我们需要在两个循环中使用相同的索引值，来确保比较的是一一对应的文本。修改后的代码如下： ``` def compare(text1, text2): similarities = [] for i in range(len(text1)): tf_idf_vectorizer = TfidfVectorizer() tf_idf_vectors = tf_idf_vectorizer.fit_transform([text1[i], text2[i]]) cosine_similarities = cosine_similarity(tf_idf_vectors) similarities.append(cosine_similarities[0, 1]) print(similarities) ``` 这样，`text1` 和 `text2` 中的文本将会一一对应地进行比较，从而得到正确的结果。

阅读全文

front_sim = cosine_similarity(word_vectors[pair1[1]], word_vectors[pair2[1]]) TypeError: 'ellipsis' object is not subscriptable 什么意思？ 怎么解决

优化这款代码def compare(): text1 = text_new text2 = text_old tf_idf_vectorizer = TfidfVectorizer() tf_idf_vectors = tf_idf_vectorizer.fit_transform([text1, text2]) cosine_similarities = cosine_similarity(tf_idf_vectors) return cosine_similarities[0, 1]增加逐一对比功能

相关推荐

Fetch_Rewards_Challenge：在Python中比较文本相似性而不导入任何库

fast-elasticsearch-vector-scoring:使用ES Lucene引擎使用嵌入向量点积或余弦相似度对文档进行评分

Python-余弦定理计算文章相似度

Word2Vec简介及基本原理解析

Word2Vec模型参数详解与调优

Cosine相似度计算原理及算法实现详解

探索基于Word2Vec的词向量表示

Traceback (most recent call last): File "E:/PyCharm Community Edition 2020.2.2/Project/WordDict/newsim.py", line 389, in <module> seed_vectors = np.reshape(np.array(seed_vectors), (seed_vectors.shape[0], -1)) AttributeError: 'list' object has no attribute 'shape' 又报错了

cos1 = torch.abs(torch.sum(v1_out * normal_gt, 1, keepdim=True))

word2vec文本相似度

word2vec计算句子相似度代码

大家在看

上海松江9000系列设备说明及调试

nacos2.4.0源码改造oracle版

ORACLE RMAN备份恢复指南

Adobe_Flash_Player_ActiveX_v34_0_0_211

地图分幅制作生产方法

最新推荐

macOS 10.9至10.13版高通RTL88xx USB驱动下载

PyCharm开发者必备：提升效率的Python环境管理秘籍

matlab中VBA指令集

在Windows Forms和WPF中实现FontAwesome-4.7.0图形

【Postman进阶秘籍】：解锁高级API测试与管理的10大技巧

ubuntu22.04怎么恢复出厂设置

2001年度广告运作规划：高效利用资源的策略

【Postman终极指南】：掌握API测试到自动化部署的全流程

叙述图神经网络领域近年来最新研究进展

Java实现深度优先遍历与id-level映射输出

front_sim = cosine_similarity(word_vectors[pair1[1]], word_vectors[pair2[1]]) TypeError: 'ellipsis' object is not subscriptable 什么意思？怎么解决