读取鸢尾花的数据集,划分特征和标签数据。同时给每个列命名中文名,设置列对齐。将特征列加入到最后一列。
时间: 2024-10-15 11:16:40 浏览: 32
基于鸢尾花数据集实现线性判别式多分类
在Python中,我们可以使用pandas库来处理鸢尾花数据集,这是一个经典的机器学习数据集,通常存储在CSV文件中。首先,你需要导入必要的库并加载数据:
```python
import pandas as pd
# 加载鸢尾花数据集,例如从sklearn.datasets导入
from sklearn.datasets import load_iris
data = load_iris()
# 将数据转换为DataFrame,方便操作
df = pd.DataFrame(data.data, columns=['花瓣长度', '花瓣宽度', '萼片长度', '萼片宽度'])
# 标签数据是数据集的target,同样转换为一列,并命名为'类别'
labels = data.target
label_names = ['山鸢尾', '变色鸢尾', '维吉尼亚鸢尾']
df['类别'] = labels.map(dict(enumerate(label_names)))
# 设置列对齐
df = df.set_index('类别', drop=True)
# 将特征列添加到最后一列,这里我们将原始的4个特征列放在最后
feature_columns = list(df.columns[:-1])
df[feature_columns] = df[[feature_columns[-1]].values
print(df.head())
```
在这个例子中,我们先创建了特征数据的DataFrame,然后添加了类别标签。最后调整了列顺序,将特征列放在了最后一列。
阅读全文