sklearn datasets数据集描述
时间: 2023-10-16 13:07:55 浏览: 113
DataSets:样本数据集
scikit-learn(sklearn)是Python中一个常用的机器学习库,它包含了许多常用的数据集,可以方便地进行数据分析和机器学习模型的训练。
以下是sklearn中常用的数据集:
1. iris数据集:鸢尾花数据集,包含3种不同种类的鸢尾花的花萼长度、花萼宽度、花瓣长度、花瓣宽度等4个特征,共有150个样本。
2. digits数据集:手写数字数据集,共有1797个样本,每个样本是一个8x8的图像,表示数字0~9。
3. wine数据集:红酒数据集,包含13个特征,共有178个样本,分为3个类别。
4. breast_cancer数据集:乳腺癌数据集,包含30个特征,共有569个样本,分为2个类别。
5. boston数据集:波士顿房价数据集,包含13个特征,共有506个样本,用于预测波士顿地区房价的中位数。
以上数据集都是经过预处理和标准化的,可以直接用于机器学习模型的训练。sklearn还有许多其他的数据集,可以根据具体需要进行选择。
阅读全文