如何使用 sklearn 库的CountVectorizer 类读取txt文本进行词向量化
时间: 2023-05-21 19:06:45 浏览: 144
matlab读取txt文本数据的方法
您可以按如下代码进行操作:
```python
from sklearn.feature_extraction.text import CountVectorizer
# 读取txt文件
with open('your_file_path.txt', 'r') as f:
corpus = f.readlines()
# 使用CountVectorizer类将文本转化为词向量
vectorizer = CountVectorizer()
X = vectorizer.fit_transform(corpus)
```
阅读全文