DataFrame 内置函数
时间: 2023-11-03 15:53:11 浏览: 106
DataFrame 是 pandas 库中的一个数据结构,它提供了许多内置函数可以对 DataFrame 进行操作和处理。以下是一些常用的 DataFrame 内置函数:
1. head():返回 DataFrame 的前几行,默认返回前 5 行。
2. tail():返回 DataFrame 的后几行,默认返回后 5 行。
3. info():显示 DataFrame 的基本信息,包括列名、数据类型、非空值个数等。
4. describe():显示 DataFrame 中数值列的统计信息,包括计数、平均值、标准差、最小值、最大值等。
5. shape:返回 DataFrame 的形状,即行数和列数。
6. columns:返回 DataFrame 的列名。
7. index:返回 DataFrame 的索引。
8. dtypes:返回 DataFrame 各列的数据类型。
9. unique():返回 DataFrame 列中的唯一值。
10. dropna():删除包含缺失值的行或列。
11. fillna():填充 DataFrame 中的缺失值。
12. groupby():按照指定的列对 DataFrame 进行分组。
13. sort_values():按照指定的列对 DataFrame 进行排序。
14. merge():根据指定的列将两个 DataFrame 进行合并。
15. pivot_table():根据指定的列生成透视表。
这些只是一些常用的内置函数,DataFrame 还有很多其他功能强大的方法可以进行数据处理和分析。
相关问题
dataframe常用函数
DataFrame是Pandas库中非常重要的数据结构,它类似于二维表格,包含了行索引和列标签。DataFrame有许多内置函数用于处理、操作和分析数据,下面是一些常用的函数:
1. **head()** 和 **tail()**:显示数据框的前几行(默认5行)或后几行,用于快速查看数据概览。
2. **info()**:提供关于数据框基本信息,如每列的数据类型、非空值的数量等。
3. **describe()**:计算每个数值型列的基本统计信息,包括计数、平均值、标准差、最小值和最大值。
4. **select_dtypes()** 或 **dtypes**:返回数据类型的别名系列,帮助识别哪些列是数值型、分类型等。
5. **shape**:获取数据框的维度,即行数和列数。
6. **loc[]** 和 **iloc[]**:位置选择,前者基于标签,后者基于整数位置。
7. **merge()** 或 **concat()**:合并多个DataFrame,可以按列或行拼接。
8. **groupby()**:对数据分组并应用聚合函数,例如求和、平均等。
9. **apply()** 和 **map()**:分别用于对每一项应用自定义函数和将序列映射到另一序列上。
10. **dropna()**:删除包含缺失值的行或列。
11. **fillna()** 或 **replace()**:填充缺失值或替换特定值。
python dataframe apply函数
Python中的DataFrame apply函数是一种数据处理函数,它可以对DataFrame中的每一列或每一行进行函数操作。apply函数可以接受一个函数作为参数,这个函数可以是自定义的函数或者是Python内置的函数。apply函数的返回值是一个Series或DataFrame对象,它们的长度与原始DataFrame的长度相同。apply函数的使用可以大大简化数据处理的过程,提高数据处理的效率。
阅读全文