python pandas 常用表格处理方法
时间: 2024-10-15 19:02:40 浏览: 40
Pandas是Python数据分析库,常用于数据清洗、转换和分析。以下是Pandas中的一些常用表格处理方法:
1. **读取数据**:
- `read_csv()`: 从CSV文件加载数据。
- `read_excel()`: 从Excel文件加载数据。
- `read_sql()` 或 `read_sql_query()`: 从数据库查询结果中读取数据。
2. **查看数据**:
- `head()`: 显示前几行,默认5行,查看数据概览。
- `tail()`: 显示后几行。
- `describe()`: 统计摘要信息,如计数、均值、标准差等。
3. **选择/过滤数据**:
- `loc[]` 和 `iloc[]`: 分别基于标签(index)和位置索引选取数据。
- `query()`: 使用SQL-like条件筛选数据。
- 切片 (`df[start:end]`):基于行或列范围选择。
4. **数据合并与连接**:
- `merge()`, `join()`: 合并两个或更多DataFrame按照键(key)。
- `concat()`: 水平或垂直拼接DataFrame。
5. **数据重塑**:
- `pivot_table()`: 将数据重塑为透视表。
- `melt()`: 数据扁平化操作。
6. **缺失值处理**:
- `isnull()`, `notnull()`: 检查缺失值。
- `dropna()`, `fillna()`: 删除或填充缺失值。
7. **分组与聚合**:
- `groupby()`: 根据一列或多列对数据进行分组,然后应用聚合函数(如sum(), mean(), count()等)。
8. **排序**:
- `sort_values()`: 按指定列进行排序。
阅读全文