pandas库常用函数及其示例代码
时间: 2023-10-08 21:10:47 浏览: 86
pandas是一个强大的数据分析和数据处理库,提供了许多常用函数来操纵和处理数据。以下是一些常用函数及其示例代码:
1. 读取数据:
```python
import pandas as pd
df = pd.read_csv('data.csv') # 从csv文件中读取数据
df = pd.read_excel('data.xlsx', sheet_name='Sheet1') # 从Excel文件中读取数据
```
2. 查看数据:
```python
df.head() # 默认查看前5行数据
df.tail(10) # 查看最后10行数据
df.shape # 查看数据的形状(行数,列数)
df.columns # 查看列名
```
3. 数据选择和过滤:
```python
df['column_name'] # 选择单个列
df[['column1', 'column2']] # 选择多个列
df.loc[row_index] # 根据行索引选择行
df.loc[row_index, 'column_name'] # 根据行索引和列名选择单个元素
df[df['column_name'] > 10] # 根据条件过滤数据
```
4. 数据排序:
```python
df.sort_values('column_name') # 按某一列排序,默认升序
df.sort_values('column_name', ascending=False) # 按某一列降序排序
```
5. 数据聚合和统计:
```python
df.groupby('column_name').mean() # 按某一列进行分组,并计算平均值
df.groupby(['column1', 'column2']).sum() # 按多个列进行分组,并计算总和
df['column_name'].sum() # 计算某一列的总和
df['column_name'].max() # 计算某一列的最大值
```
6. 数据处理:
```python
df.dropna() # 删除包含缺失值的行
df.fillna(value) # 将缺失值填充为指定值
df.drop_duplicates() # 删除重复的行
df.rename(columns={'old_name': 'new_name'}) # 重命名列名
```
阅读全文