dataframe统计分别每一列的样本均值、样本标准差、样本超额风度,最小值与最大值并做成一个新的dataframe
时间: 2024-09-15 16:13:38 浏览: 78
在Pandas库中,可以使用`describe()`函数快速获取DataFrame中每列的基本统计信息,包括计数、平均值(均值)、标准差、最小值、四分位数以及最大值。不过,`describe()`不直接提供“超额风度”(skewness),这通常需要额外计算。我们可以先用`describe()`获取基本信息,然后用`skew()`函数计算超额风度。这里有一个示例:
```python
import pandas as pd
# 假设df是你的DataFrame
stats_df = df.describe(include='all') # 包含所有统计信息
stats_df['Skewness'] = df.apply(lambda col: col.skew(), axis=0) # 计算每列的超额风度
# 找出最小值和最大值
min_max_df = pd.DataFrame({
'Min': df.min(numeric_only=True),
'Max': df.max(numeric_only=True)
})
# 合并两个数据框
result_df = stats_df.merge(min_max_df, left_index=True, right_index=True)
print(result_df)
```
注意这里的`numeric_only=True`用于只处理数值型列。
阅读全文