pandas库的函数大全即用法
时间: 2023-08-07 07:07:52 浏览: 117
pandas常用函数
Pandas库是Python数据分析中常用的库之一,以下是Pandas库中常用的函数及其用法:
1. 读取数据
- read_csv:读取CSV文件;
- read_excel:读取Excel文件;
- read_sql_table:读取SQL表格;
- read_sql_query:执行SQL查询,并将结果读取到DataFrame中;
- read_html:读取HTML表格。
2. 基本操作
- head:查看DataFrame的前几行;
- tail:查看DataFrame的后几行;
- shape:查看DataFrame的形状;
- columns:查看DataFrame的列名;
- index:查看DataFrame的索引;
- info:查看DataFrame的信息;
- describe:查看DataFrame的统计信息;
- loc:按标签选择行或列;
- iloc:按位置选择行或列;
- at:获取某个标签位置的值;
- iat:获取某个位置的值;
- drop:删除某行或某列;
- dropna:删除缺失值;
- fillna:填充缺失值;
- replace:替换某个值;
- merge:按照某一列进行合并;
- concat:将两个或多个DataFrame按行或列进行合并。
3. 数据筛选与统计
- query:筛选符合条件的行;
- groupby:按照某一列进行分组;
- pivot_table:根据指定的行和列进行数据透视;
- value_counts:计算Series中每个值出现的次数;
- sort_values:按某一列进行排序;
- nlargest:获取某一列中最大的几个值;
- nsmallest:获取某一列中最小的几个值;
- isnull:检查DataFrame中的缺失值;
- unique:返回Series中的唯一值;
- nunique:返回Series中唯一值的数量;
- count:计算非缺失值的数量;
- sum:计算DataFrame或Series的总和;
- mean:计算DataFrame或Series的平均值;
- median:计算DataFrame或Series的中位数;
- std:计算DataFrame或Series的标准差;
- var:计算DataFrame或Series的方差;
- corr:计算DataFrame或Series的相关系数矩阵;
- cov:计算DataFrame或Series的协方差矩阵。
4. 数据可视化
- plot:绘制DataFrame或Series的线图;
- scatter:绘制DataFrame或Series的散点图;
- hist:绘制DataFrame或Series的直方图;
- bar:绘制DataFrame或Series的柱状图;
- pie:绘制DataFrame或Series的饼图;
- boxplot:绘制DataFrame或Series的箱线图;
- heatmap:绘制DataFrame的热力图。
以上是Pandas库中常用的函数及其用法,但仅仅列出这些是远远不够的,需要在实践中不断学习和积累。
阅读全文