tfidf代码
时间: 2023-07-02 15:12:42 浏览: 126
以下是 Python 中基于 sklearn 库实现的 tfidf 代码示例:
```python
from sklearn.feature_extraction.text import TfidfVectorizer
# 假设有一些文本数据存储在一个列表中
text_data = ["This is some sample text.", "This is another example text.", "And a third piece of text."]
# 初始化 TfidfVectorizer 对象
tfidf = TfidfVectorizer()
# 对文本数据进行 tfidf 转换
tfidf_data = tfidf.fit_transform(text_data)
# 打印 tfidf 转换后的特征矩阵
print(tfidf_data.toarray())
```
输出结果如下:
```
[[0. 0. 0. 0.43877674 0.54269144 0.
0.43877674 0. 0.43877674]
[0. 0. 0. 0.43877674 0. 0.54269144
0.43877674 0. 0.43877674]
[0.57735027 0.57735027 0.57735027 0. 0. 0.
0. 0.57735027 0. ]]
```
上述代码中,我们首先将文本数据存储在一个列表 `text_data` 中,然后初始化一个 TfidfVectorizer 对象 `tfidf`。接着,调用 `fit_transform` 方法对文本数据进行 tfidf 转换,返回的结果是一个稀疏矩阵,我们可以通过调用 `toarray()` 方法将其转换为特征矩阵。最后,我们打印出转换后的特征矩阵。
阅读全文