加载鸢尾花iris.data数据集输出数据的样本集和原始目标集和转为分类号后的目标集,输出花萼的长度和花瓣的长度这两个特征列
时间: 2024-09-06 21:04:41 浏览: 48
在Python中,鸢尾花数据集通常可以通过`sklearn`库中的`datasets`模块进行加载。以下是如何加载鸢尾花数据集并输出样本集、原始目标集以及转为分类号后的目标集的代码示例,同时会展示花萼长度和花瓣长度这两个特征列的数据。
```python
from sklearn.datasets import load_iris
import pandas as pd
# 加载鸢尾花数据集
iris = load_iris()
# 将数据集转换为DataFrame,方便查看数据
iris_df = pd.DataFrame(iris.data, columns=iris.feature_names)
iris_df['species'] = pd.Categorical.from_codes(iris.target, iris.target_names)
# 输出原始数据集的前几行
print("样本集(原始特征):")
print(iris_df.head())
# 输出原始目标集(鸢尾花的种类)
print("\n原始目标集:")
print(iris_df['species'].head())
# 输出转为分类号后的目标集
print("\n转为分类号后的目标集:")
print(iris.target[:5])
# 输出花萼的长度和花瓣的长度这两个特征列
print("\n花萼长度和花瓣长度特征列:")
print(iris_df[['sepal length (cm)', 'petal length (cm)']].head())
```
在上述代码中,我们首先导入了必要的`sklearn`和`pandas`库。通过`load_iris`函数获取鸢尾花数据集,并使用`pd.Categorical.from_codes`方法将目标值转换为分类名称。然后,我们创建了一个`DataFrame`来更好地展示数据,并展示了数据集的前几行、原始目标集和转为分类号后的目标集。最后,我们指定了花萼长度和花瓣长度这两列的数据进行展示。
阅读全文