python自带数据集_sklearn 内置数据集中与分类问题相关的数据集
时间: 2023-07-09 08:07:15 浏览: 117
SKlearn数据集.zip
sklearn内置数据集中与分类问题相关的数据集有以下几个:
1. iris(鸢尾花)数据集:一个非常著名的多分类问题数据集,包含了3类共150个样本,每类50个样本,每个样本包含4个特征。
2. digits(手写数字)数据集:一个非常常用的图像分类问题数据集,包含了10个类别共1797个样本,每个样本是一个8x8的灰度图像。
3. breast_cancer(乳腺癌)数据集:一个二分类问题数据集,包含了569个样本,每个样本包含30个特征,用于预测样本是否为恶性乳腺肿瘤。
4. newsgroups(新闻组)数据集:一个文本分类问题数据集,包含了20个类别共18846个新闻样本,每个样本是一篇新闻文章。
这些数据集都可以通过sklearn的load_函数进行加载。例如,加载iris数据集可以使用以下代码:
```
from sklearn.datasets import load_iris
iris = load_iris()
X, y = iris.data, iris.target
```
阅读全文