pandas表格数据处理
时间: 2023-11-22 19:49:41 浏览: 93
数据处理中最强有力也最流行的工具之一:Pandas!.docx
以下是使用pandas对表格数据进行处理的一些常用方式:
1.读取Excel文件
```python
import pandas as pd
df = pd.read_excel('filename.xlsx', sheet_name='Sheet1')
```
2.读取CSV文件
```python
import pandas as pd
df = pd.read_csv('filename.csv')
```
3.查看数据
```python
print(df.head()) # 查看前5行数据
print(df.tail()) # 查看后5行数据
print(df.info()) # 查看数据信息
print(df.describe()) # 查看数据统计信息
```
4.数据清洗
```python
df.dropna() # 删除缺失值
df.drop_duplicates() # 删除重复值
df.fillna(value) # 填充缺失值
df.replace(old_value, new_value) # 替换值
```
5.数据筛选
```python
df[df['column'] > value] # 按条件筛选
df.loc[row_indexer, column_indexer] # 按标签筛选
df.iloc[row_indexer, column_indexer] # 按位置筛选
```
6.数据排序
```python
df.sort_values(by='column', ascending=False) # 按列排序
df.sort_index() # 按索引排序
```
7.数据分组
```python
df.groupby('column').mean() # 按列分组并计算平均值
```
8.数据合并
```python
df1.merge(df2, on='column') # 按列合并
```
阅读全文