from sklearn.datasets import fetch_20newsgroups categories = ['alt.atheism', 'soc.religion.christian'] newsgroups_train = fetch_20newsgroups(subset='train', categories=categories) newsgroups_test = fetch_20newsgroups(subset='test', categories=categories) class_names = ['atheism', 'christian']
时间: 2024-01-30 19:03:54 浏览: 173
20newsgroup数据集-机器学习-标准数据集(all)下载方式 from sklearn.datasets import fetch_20newsgrou
这段代码是用来获取20个新闻组数据集中关于“无神论”和“基督教”两个类别的训练和测试数据。首先,通过从sklearn.datasets中导入fetch_20newsgroups函数获取完整的20个新闻组数据集。然后,由于我们只需要“无神论”和“基督教”两个类别的数据,因此通过设置categories参数来获取这两个类别的数据。接着,分别获取训练集和测试集数据,并将类别名存储在class_names变量中。
阅读全文