DataFrame数据的基本统计信息函数都有什么
时间: 2024-05-23 15:15:03 浏览: 36
DataFrame数据的基本统计信息函数包括:describe()、mean()、median()、var()、std()、min()、max()、skew()、kurtosis()、count()、sum()等。其中,describe()函数会输出DataFrame数据的基本统计信息总览,包括计数、均值、标准差、最小值、下四分位数、中位数、上四分位数和最大值。其他函数则是输出DataFrame数据的特定统计信息。
相关问题
dataframe数据统计
要对DataFrame数据进行统计,可以使用pandas库中的一些统计函数。下面是一些常用的统计函数示例:
1. `describe()`: 返回关于DataFrame列的各种统计信息,包括计数、均值、标准差、最小值、25%分位数、中位数、75%分位数和最大值。
```python
import pandas as pd
# 创建示例数据
data = {'A': [1,2, 3, 4, 5],
'B': [10, 20, 30, 40, 50],
'C': [100, 200, 300, 400, 500]}
df = pd.DataFrame(data)
# 使用describe函数进行统计
stats = df.describe()
print(stats)
```
2. `mean()`: 返回DataFrame中每列的平均值。
```python
import pandas as pd
# 创建示例数据
data = {'A': [1,2, 3, 4, 5],
'B': [10, 20, 30, 40, 50],
'C': [100, 200, 300, 400, 500]}
df = pd.DataFrame(data)
# 使用mean函数计算平均值
means = df.mean()
print(means)
```
3. `sum()`: 返回DataFrame中每列的总和。
```python
import pandas as pd
# 创建示例数据
data = {'A': [1, 2, 3, 4, 5],
'B': [10, 20, 30, 40, 50],
'C': [100, 200, 300, 400, 500]}
df = pd.DataFrame(data)
# 使用sum函数计算总和
sums = df.sum()
print(sums)
```
还有其他一些常用的统计函数,如`min()`(最小值)、`max()`(最大值)、`std()`(标准差)、`median()`(中位数)等,你可以根据需求选择适合的函数进行统计。
DataFrame的基本函数
DataFrame是Pandas库中的一个数据结构,用于处理二维表格数据。下面是DataFrame的一些基本函数:
1. head():查看DataFrame的前几行数据,默认是前5行。
2. tail():查看DataFrame的后几行数据,默认是后5行。
3. info():查看DataFrame的基本信息,包括每一列的数据类型、数据条数、缺失值情况等。
4. describe():对DataFrame的数值列进行统计描述,包括计数、均值、标准差、最小值、25%分位数、中位数、75%分位数、最大值等。
5. shape:查看DataFrame的维度。
6. columns:查看DataFrame的列名。
7. index:查看DataFrame的行名。
8. loc[]:按行列标签进行数据访问,如df.loc[2,'name']。
9. iloc[]:按行列位置进行数据访问,如df.iloc[1,3]。
10. drop():删除指定行或列,如df.drop('name',axis=1)删除name列。
11. dropna():删除有缺失值的行或列。
12. fillna():填充缺失值。
13. groupby():对数据进行分组操作。
14. merge():按照指定的列名将两个DataFrame进行合并。
15. pivot_table():对DataFrame进行透视操作。