首页统计鸢尾花数据集各维度上的最大值，最小值、均值、标准方差

统计鸢尾花数据集各维度上的最大值，最小值、均值、标准方差

时间: 2024-10-09 11:04:09 浏览: 51

统计鸢尾花数据集各维度上的数值分布，包括最大值、最小值、均值和标准方差，可以用Pandas库配合NumPy库来完成。首先，我们将数据从sklearn的数据对象转化为DataFrame，然后对每个特征进行描述性统计分析。以下是示例代码： ```python import numpy as np import pandas as pd from sklearn.datasets import load_iris # 加载鸢尾花数据集 iris = load_iris() df_iris = pd.DataFrame(data=np.c_[iris['data'], iris['target']], columns=iris['feature_names'] + ['target']) # 对所有特征进行描述性统计 stat_summary = df_iris.describe(include='all') # 'describe()'会返回一个包含统计量的DataFrame，其中包含： # count：非空值的数量 # mean：平均值 # std：标准差 # min：最小值 # 25%, 50%, 75%：四分位数 # max：最大值 print(stat_summary) ``` 运行这段代码后，你会看到每个特征的最大值、最小值、平均值和标准差。

阅读全文