首页读取鸢尾花的数据集，划分特征和标签数据。同时给每个列命名中文名，设置列对齐。将特征列加入到最后一列。

读取鸢尾花的数据集，划分特征和标签数据。同时给每个列命名中文名，设置列对齐。将特征列加入到最后一列。

时间: 2024-10-15 22:16:40 浏览: 39

鸢尾花(iris)数据集

Iris 鸢尾花数据集是一个经典数据集，在统计学习和机器学习领域都经常被用作示例。数据集内包含 3 类共 150 条记录，每类各 50 个数据，每条记录都有 4 项特征：花萼长度、花萼宽度、花瓣长度、花瓣宽度，可以通过这4个特征预测鸢尾花卉属于（iris-setosa, iris-versicolour, iris-virginica）中的哪一品种。

在Python中，我们可以使用pandas库来处理鸢尾花数据集，这是一个经典的机器学习数据集，通常存储在CSV文件中。首先，你需要导入必要的库并加载数据： ```python import pandas as pd # 加载鸢尾花数据集，例如从sklearn.datasets导入 from sklearn.datasets import load_iris data = load_iris() # 将数据转换为DataFrame，方便操作 df = pd.DataFrame(data.data, columns=['花瓣长度', '花瓣宽度', '萼片长度', '萼片宽度']) # 标签数据是数据集的target，同样转换为一列，并命名为'类别' labels = data.target label_names = ['山鸢尾', '变色鸢尾', '维吉尼亚鸢尾'] df['类别'] = labels.map(dict(enumerate(label_names))) # 设置列对齐 df = df.set_index('类别', drop=True) # 将特征列添加到最后一列，这里我们将原始的4个特征列放在最后 feature_columns = list(df.columns[:-1]) df[feature_columns] = df[[feature_columns[-1]].values print(df.head()) ``` 在这个例子中，我们先创建了特征数据的DataFrame，然后添加了类别标签。最后调整了列顺序，将特征列放在了最后一列。

阅读全文