Python3.7 pandas模块
时间: 2023-10-07 17:10:01 浏览: 140
python pandas
5星 · 资源好评率100%
pandas是一个基于NumPy的Python数据分析库,它可以快速便捷地处理大量数据。
安装pandas模块:
在命令行输入以下命令:
```
pip install pandas
```
导入pandas模块:
在Python代码中,可以使用以下语句导入pandas模块:
```
import pandas as pd
```
pandas主要的数据结构:
pandas主要有两种数据结构,分别是Series和DataFrame。
Series是一种类似于一维数组的对象,它由一组数据以及一组与之相关的标签(即索引)组成。
DataFrame是一个表格型的数据结构,它包含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等),DataFrame既有行索引也有列索引,可以看做是由Series组成的字典。
pandas常用函数:
pandas提供了很多函数,下面列出一些常用的函数:
- read_csv():读取CSV文件;
- to_csv():将数据写入CSV文件;
- head():查看前n行数据;
- tail():查看后n行数据;
- shape():查看数据的形状;
- describe():描述数据的基本统计信息;
- info():查看数据的基本信息;
- groupby():按照指定的列分组;
- merge():根据指定的列合并两个DataFrame;
- apply():对指定的列进行函数操作;
- sort_values():按照指定的列进行排序;
- drop():删除指定的行或列;
- fillna():填充缺失数据;
- replace():替换指定的数据;
- isnull():判断数据是否为缺失值;
- notnull():判断数据是否不为缺失值。
阅读全文