DataFrame常用统计数据方法
时间: 2023-11-03 20:31:02 浏览: 86
DataFrame常用的统计数据方法有:
1. describe():展示数值型列的基本统计信息,包括计数、均值、标准差、最小值、最大值等。
2. mean():计算每列的均值。
3. median():计算每列的中位数。
4. mode():计算每列的众数。
5. std():计算每列的标准差。
6. var():计算每列的方差。
7. quantile():计算每列的分位数,可以指定分位数的值。
8. corr():计算各列之间的相关系数。
9. cov():计算各列之间的协方差。
10. count():计算每列的非空值数量。
11. sum():计算每列的总和。
12. min():计算每列的最小值。
13. max():计算每列的最大值。
14. abs():计算每列的绝对值。
15. cumsum():计算每列的累计和。
16. cumprod():计算每列的累计积。
相关问题
pd.DataFrame常用统计函数
Pandas 的 DataFrame 类提供了许多常用的统计函数,用于计算和分析数据。以下是一些常用的统计函数示例:
- `df.mean()`: 计算每列的平均值。
- `df.median()`: 计算每列的中位数。
- `df.min()`: 计算每列的最小值。
- `df.max()`: 计算每列的最大值。
- `df.std()`: 计算每列的标准差。
- `df.var()`: 计算每列的方差。
- `df.sum()`: 计算每列的总和。
- `df.count()`: 计算每列的非空值数量。
- `df.describe()`: 提供有关每列的基本统计摘要,包括计数、均值、标准差、最小值、25%、50%、75% 分位数和最大值。
这些函数可以应用于整个 DataFrame,或者通过指定轴参数应用于特定的行或列。你还可以通过在这些函数后面添加 `axis` 参数来指定计算的轴方向,默认为按列计算。
除了上述示例之外,Pandas 还提供了许多其他统计函数,如协方差、相关性、百分位数等。你可以根据具体的需求选择适当的函数来分析和处理数据。
DataFrame常用方法
DataFrame是Pandas库中最常用的数据结构之一,它类似于Excel表格,由多行多列的数据组成。下面介绍一些DataFrame常用的方法:
1. head()和tail()方法:分别返回DataFrame的前几行和后几行数据,默认返回前/后五行。
2. info()方法:查看DataFrame的基本信息,包括列名、数据类型、非空值数量、内存占用等。
3. describe()方法:返回DataFrame的基本统计信息,包括计数、平均值、标准差、最小值、最大值等。
4. shape属性:返回DataFrame的行数和列数。
5. columns属性:返回DataFrame的列名。
6. index属性:返回DataFrame的索引。
7. loc[]方法:通过标签定位数据,例如df.loc[0]表示返回第一行数据。
8. iloc[]方法:通过位置定位数据,例如df.iloc[0]表示返回第一行数据。
9. drop()方法:删除指定行或列,需要指定axis参数,axis=0表示删除行,axis=1表示删除列。
10. drop_duplicates()方法:去重,可以指定去重的列。
11. groupby()方法:按照指定列进行分组,可以对分组后的数据进行聚合操作,例如求平均值、求和等。
12. merge()方法:合并多个DataFrame,需要指定合并的列。
13. pivot_table()方法:创建数据透视表,用于对数据进行汇总和分析。
14. apply()方法:对DataFrame中的每个元素应用指定的函数。
15. sort_values()方法:按照指定列排序。
16. set_index()方法:将指定列设置为索引。
这些方法只是DataFrame中的一部分常用方法,还有很多其他方法可以根据需要使用。
阅读全文