文本分类数据集及下载链接
时间: 2023-11-20 21:06:42 浏览: 151
以下是一些常用的文本分类数据集,以及它们的下载链接:
1. 20 Newsgroups:包含20个不同主题的新闻组文章,用于文本分类任务。下载链接:http://qwone.com/~jason/20Newsgroups/
2. Reuters-21578:包含21,578篇新闻文章,用于文本分类任务。下载链接:https://archive.ics.uci.edu/ml/datasets/reuters-21578+text+categorization+collection
3. IMDB电影评论数据集:包含25,000条IMDB电影评论,用于情感分析任务。下载链接:http://ai.stanford.edu/~amaas/data/sentiment/
4. 情感分析中文数据集:包含了5000条中文评论数据,用于情感分析任务。下载链接:https://github.com/SophonPlus/ChineseNlpCorpus/blob/master/datasets/sentiment_analysis/sentiment_analysis_v1.0.zip
5. AG News:包含120,000篇新闻文章,用于文本分类任务。下载链接:https://drive.google.com/file/d/0Bz8a_Dbh9QhbaW12WVVZS2drcnM/view
6. Yelp评论数据集:包含5,000,000条Yelp评论数据,用于情感分析任务。下载链接:https://www.yelp.com/dataset/download
7. DBpedia:包含5,000,000篇维基百科文章,用于文本分类任务。下载链接:https://wiki.dbpedia.org/services-resources/datasets/dbpedia-datasets
8. Amazon评论数据集:包含142.8万条亚马逊商品评论,用于情感分析任务。下载链接:https://jmcauley.ucsd.edu/data/amazon/
阅读全文