统计鸢尾花数据集各维度上的最大值,最小值、均值、标准方差
时间: 2024-10-09 11:04:09 浏览: 51
统计鸢尾花数据集各维度上的数值分布,包括最大值、最小值、均值和标准方差,可以用Pandas库配合NumPy库来完成。首先,我们将数据从sklearn的数据对象转化为DataFrame,然后对每个特征进行描述性统计分析。
以下是示例代码:
```python
import numpy as np
import pandas as pd
from sklearn.datasets import load_iris
# 加载鸢尾花数据集
iris = load_iris()
df_iris = pd.DataFrame(data=np.c_[iris['data'], iris['target']], columns=iris['feature_names'] + ['target'])
# 对所有特征进行描述性统计
stat_summary = df_iris.describe(include='all')
# 'describe()'会返回一个包含统计量的DataFrame,其中包含:
# count:非空值的数量
# mean:平均值
# std:标准差
# min:最小值
# 25%, 50%, 75%:四分位数
# max:最大值
print(stat_summary)
```
运行这段代码后,你会看到每个特征的最大值、最小值、平均值和标准差。
阅读全文