从SKLearn 加载数据集(例如鸢尾花)并输出
时间: 2024-09-13 12:16:38 浏览: 41
从SKLearn(Scikit-learn)库加载数据集是机器学习中常见的数据准备步骤。鸢尾花数据集(Iris dataset)是常用的一个多变量数据集,包含了三种不同的鸢尾花(Setosa、Versicolour和Virginica)的50个样本,每个类都有4个属性:萼片长度、萼片宽度、花瓣长度和花瓣宽度。
以下是使用Python和Scikit-learn库加载鸢尾花数据集并输出的步骤:
1. 首先,需要安装Scikit-learn库(如果尚未安装),可以使用pip命令安装:
```bash
pip install scikit-learn
```
2. 然后,在Python代码中导入`datasets`模块,并使用`load_iris`函数加载数据集:
```python
from sklearn import datasets
# 加载鸢尾花数据集
iris = datasets.load_iris()
```
3. 加载后的`iris`对象包含了数据集的特征和目标变量,可以通过`iris.data`访问特征数据,通过`iris.target`访问目标变量数据。`iris.feature_names`包含了特征名称,`iris.target_names`包含了目标变量的类别名称。
4. 接下来,可以将数据集的特征和目标变量打印输出:
```python
# 输出特征数据
print("特征数据:")
print(iris.data)
# 输出目标变量数据
print("目标变量数据:")
print(iris.target)
# 输出特征名称
print("特征名称:")
print(iris.feature_names)
# 输出目标变量的类别名称
print("目标变量的类别名称:")
print(iris.target_names)
```
这段代码将输出鸢尾花数据集的所有特征数据、目标变量数据,以及相关的名称信息。
阅读全文