dataframe常用函数
时间: 2024-08-14 13:05:30 浏览: 71
Numpy及Pandas_numpy_pandas_dataframe_python_
DataFrame是Pandas库中非常重要的数据结构,它类似于二维表格,包含了行索引和列标签。DataFrame有许多内置函数用于处理、操作和分析数据,下面是一些常用的函数:
1. **head()** 和 **tail()**:显示数据框的前几行(默认5行)或后几行,用于快速查看数据概览。
2. **info()**:提供关于数据框基本信息,如每列的数据类型、非空值的数量等。
3. **describe()**:计算每个数值型列的基本统计信息,包括计数、平均值、标准差、最小值和最大值。
4. **select_dtypes()** 或 **dtypes**:返回数据类型的别名系列,帮助识别哪些列是数值型、分类型等。
5. **shape**:获取数据框的维度,即行数和列数。
6. **loc[]** 和 **iloc[]**:位置选择,前者基于标签,后者基于整数位置。
7. **merge()** 或 **concat()**:合并多个DataFrame,可以按列或行拼接。
8. **groupby()**:对数据分组并应用聚合函数,例如求和、平均等。
9. **apply()** 和 **map()**:分别用于对每一项应用自定义函数和将序列映射到另一序列上。
10. **dropna()**:删除包含缺失值的行或列。
11. **fillna()** 或 **replace()**:填充缺失值或替换特定值。
阅读全文