首页从SKLearn 加载数据集（例如鸢尾花）并输出

从SKLearn 加载数据集（例如鸢尾花）并输出

时间: 2024-09-13 12:16:38 浏览: 41

从SKLearn（Scikit-learn）库加载数据集是机器学习中常见的数据准备步骤。鸢尾花数据集（Iris dataset）是常用的一个多变量数据集，包含了三种不同的鸢尾花（Setosa、Versicolour和Virginica）的50个样本，每个类都有4个属性：萼片长度、萼片宽度、花瓣长度和花瓣宽度。以下是使用Python和Scikit-learn库加载鸢尾花数据集并输出的步骤： 1. 首先，需要安装Scikit-learn库（如果尚未安装），可以使用pip命令安装： ```bash pip install scikit-learn ``` 2. 然后，在Python代码中导入`datasets`模块，并使用`load_iris`函数加载数据集： ```python from sklearn import datasets # 加载鸢尾花数据集 iris = datasets.load_iris() ``` 3. 加载后的`iris`对象包含了数据集的特征和目标变量，可以通过`iris.data`访问特征数据，通过`iris.target`访问目标变量数据。`iris.feature_names`包含了特征名称，`iris.target_names`包含了目标变量的类别名称。 4. 接下来，可以将数据集的特征和目标变量打印输出： ```python # 输出特征数据 print("特征数据:") print(iris.data) # 输出目标变量数据 print("目标变量数据:") print(iris.target) # 输出特征名称 print("特征名称:") print(iris.feature_names) # 输出目标变量的类别名称 print("目标变量的类别名称:") print(iris.target_names) ``` 这段代码将输出鸢尾花数据集的所有特征数据、目标变量数据，以及相关的名称信息。

阅读全文