首页从sklearn中导入数据集，加载虹膜数据集，列出虹膜数据的四个特征名称，然后挑出萼片长度小于等于五花瓣宽度大于等于0.2的花的行指数，从虹膜数据中列出所有对应记录

从sklearn中导入数据集，加载虹膜数据集，列出虹膜数据的四个特征名称，然后挑出萼片长度小于等于五花瓣宽度大于等于0.2的花的行指数，从虹膜数据中列出所有对应记录

时间: 2024-09-24 14:24:24 浏览: 62

在Python的scikit-learn库中，你可以通过`load_iris()`函数加载经典的鸢尾花数据集。这个数据集包含了150个样本，每个样本有4个特征：花萼长度（sepal length）、花萼宽度（sepal width）、花瓣长度（petal length）和花瓣宽度（petal width），共分为三个类别：山鸢尾（setosa）、变色鸢尾（versicolor）和维吉尼亚鸢尾（virginica）。首先，我们来加载数据并查看特征名称： ```python from sklearn.datasets import load_iris import pandas as pd # 加载数据 iris = load_iris() data = iris.data feature_names = iris.feature_names print("特征名称：", feature_names) ``` 接下来，我们将筛选出萼片长度小于等于5厘米且花瓣宽度大于等于0.2厘米的花的数据行索引。这需要创建一个新的条件，这里假设你想用pandas DataFrame的方式来操作： ```python # 将数据转换成DataFrame df_iris = pd.DataFrame(data, columns=feature_names) # 定义筛选条件 condition = (df_iris['sepal length (cm)'] <= 5) & (df_iris['petal width (cm)'] >= 0.2) filtered_indices = df_iris[condition].index.tolist() # 获取满足条件的行索引 filtered_data = df_iris.loc[filtered_indices] # 筛选出对应的记录 print("满足条件的行索引：", filtered_indices) print("筛选后的数据：") print(filtered_data) ``` 请注意，上述操作假设了花瓣宽度是以厘米为单位的，因为原始数据集就是如此。如果实际数据中的花瓣宽度单位不同，你需要相应地调整筛选条件。

阅读全文