加载鸢尾花数据集输出数据的样本集和原始目标集和转为分类号后的目标集,输出花萼的长度和花瓣的长度这两个特征列
时间: 2024-09-06 16:04:37 浏览: 43
-KNN算法实现鸢尾花数据集分类-C语言实现-IrisClassification-KNNAlgorithm.zip
鸢尾花数据集(Iris dataset)是一个非常著名的用于模式识别和机器学习研究的数据集,由英国统计学家和生物学家罗纳德·费舍尔(Ronald Fisher)在1936年整理。该数据集包含150个样本,分为三个种类的鸢尾花(Setosa、Versicolour和Virginica),每个种类有50个样本。每个样本有四个特征:花萼长度(sepal length)、花萼宽度(sepal width)、花瓣长度(petal length)和花瓣宽度(petal width)。
为了加载鸢尾花数据集并输出数据的样本集、原始目标集和转为分类号后的目标集,以及输出花萼的长度和花瓣的长度这两个特征列,我们可以使用Python中的`sklearn`库来实现。下面是一个示例代码:
```python
from sklearn.datasets import load_iris
import pandas as pd
# 加载鸢尾花数据集
iris = load_iris()
iris_df = pd.DataFrame(data=iris.data, columns=iris.feature_names)
iris_df['target'] = iris.target
iris_df['target_name'] = iris.target_names
# 输出数据的样本集
print("样本集:")
print(iris_df.head())
# 输出原始目标集
print("\n原始目标集:")
print(iris_df['target_name'].head())
# 输出转为分类号后的目标集
print("\n转为分类号后的目标集:")
print(iris_df['target'].head())
# 输出花萼的长度和花瓣的长度这两个特征列
print("\n特征列(花萼长度和花瓣长度):")
print(iris_df[['sepal length (cm)', 'petal length (cm)']].head())
```
这段代码首先从`sklearn.datasets`模块加载鸢尾花数据集,然后使用`pandas`库创建一个`DataFrame`对象,以便更好地处理数据。之后,它输出了数据的样本集、原始目标集、转为分类号后的目标集,并特别输出了花萼的长度和花瓣的长度这两个特征列。
阅读全文