TfidfVectorizer(ngram_range=(1,3),max_features=3000)
时间: 2024-06-07 18:05:29 浏览: 18
这是一个基于TF-IDF算法的文本特征提取器,其中ngram_range=(1,3)表示提取文本的1-3个词组合作为特征,max_features=3000表示提取3000个特征作为模型输入。TF-IDF算法可以用来评估一个词在一个文本中的重要程度,它的值与一个词在文本中出现的频率成正比,与在语料库中出现的频率成反比,常用于文本分类、聚类和信息检索等任务中。
相关推荐
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![gz](https://img-home.csdnimg.cn/images/20210720083447.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![gz](https://img-home.csdnimg.cn/images/20210720083447.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)