stop_words是这样定义的stop_words=ENGLISH_STOP_WORDS
时间: 2023-07-05 11:24:13 浏览: 171
根据您提供的信息,如果您使用的是 scikit-learn 中的 TfidfVectorizer,那么 ENGLISH_STOP_WORDS 应该是一个预定义的常量,它是一个包含英语中常见无用单词的集合。如果您在定义 TfidfVectorizer 对象时传入了 stop_words=ENGLISH_STOP_WORDS 参数,那么您需要确认 ENGLISH_STOP_WORDS 的值是否正确,它应该是一个集合(set)类型的对象,其中包含了英语中常见无用单词的字符串。
如果 ENGLISH_STOP_WORDS 的值正确,但是依然出现了 InvalidParameterError 错误,那么您可以尝试将 stop_words 参数设置为 'english',或者将 ENGLISH_STOP_WORDS 转换成列表类型,然后传入 TfidfVectorizer 对象的 stop_words 参数中。例如:
```
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.feature_extraction.text import ENGLISH_STOP_WORDS
# 将 ENGLISH_STOP_WORDS 转换成列表类型
stop_words = list(ENGLISH_STOP_WORDS)
# 定义 TfidfVectorizer 对象
tfidfVec = TfidfVectorizer(stop_words=stop_words)
```
或者
```
from sklearn.feature_extraction.text import TfidfVectorizer
# 定义 TfidfVectorizer 对象
tfidfVec = TfidfVectorizer(stop_words='english')
```
请注意,这里的 stop_words 参数是在实例化 TfidfVectorizer 对象时传入的,而不是在调用 fit() 方法时传入的。
阅读全文