python tfidf词频统计
时间: 2023-06-29 13:20:31 浏览: 177
简单理解TFIDF及其算法python实现
在Python中,可以使用scikit-learn库中的TfidfVectorizer来进行TF-IDF词频统计。下面是一个简单的示例代码:
```python
from sklearn.feature_extraction.text import TfidfVectorizer
# 文本列表
text_list = ['This is the first document.', 'This is the second document.', 'And this is the third one.']
# 创建TfidfVectorizer对象
vectorizer = TfidfVectorizer()
# 转换文本列表为TF-IDF矩阵
tfidf_matrix = vectorizer.fit_transform(text_list)
# 输出TF-IDF矩阵
print(tfidf_matrix.toarray())
```
运行上述代码,将输出一个3行7列的矩阵,其中每一行代表一个文本,在每一列中给出了对应的单词的TF-IDF值。
阅读全文