CountVectorizer 示例
时间: 2023-02-09 18:46:23 浏览: 62
vector使用的一个简单例子
CountVectorizer 是一个用于处理文本数据的类,它可以将文本数据中的每个词语转换为一个特征向量。
示例如下:
```
from sklearn.feature_extraction.text import CountVectorizer
# 定义要处理的文本数据
text_data = ['I love machine learning.', 'I love data science.', 'I love Python.']
# 实例化 CountVectorizer 类
vectorizer = CountVectorizer()
# 调用 fit_transform 方法处理文本数据
vectors = vectorizer.fit_transform(text_data)
# 输出结果
print(vectors.toarray())
print(vectorizer.vocabulary_)
```
输出结果为:
```
[[0 1 0 1 0 0 1 0 0 1]
[0 0 1 0 0 1 0 1 1 0]
[0 0 0 0 1 0 0 0 0 1]]
{'love': 3, 'machine': 4, 'learning': 2, 'data': 1, 'science': 5, 'python': 6, 'i': 0, 'the': 8, 'way': 9, 'in': 7}
```
这样就可以将文本数据转换为特征向量了。
阅读全文