pandas用法演示
时间: 2024-08-12 15:01:48 浏览: 47
pandas.cut具体使用总结
Pandas是一个强大的数据处理库,用于Python语言,它提供了一种方便的方式来操作表格型数据。下面我会简单演示一些基本的pandas用法:
1. **导入库**:
```python
import pandas as pd
```
2. **读取数据**:
- 从CSV文件读取:
```python
data = pd.read_csv('file.csv')
```
- 从Excel文件读取:
```python
data = pd.read_excel('file.xlsx')
```
3. **查看数据基本信息**:
```python
print(data.head()) # 显示前几行
print(data.info()) # 显示列名、非空值数量等信息
```
4. **数据清洗和预处理**:
- 查看缺失值:
```python
missing_values = data.isnull().sum()
```
- 删除缺失值:
```python
data.dropna(inplace=True) # 默认删除所有含有缺失值的行
```
5. **数据筛选和分组**:
```python
filtered_data = data[data['column'] > value] # 筛选特定条件的数据
grouped_data = data.groupby('column_name').agg({'另一列': 'sum'}) # 按照某一列分组并计算总和
```
6. **数据透视表**:
```python
pivot_table = data.pivot_table(values='value', index='index_column', columns='group_column')
```
7. **数据保存**:
```python
data.to_csv('new_file.csv', index=False) # 保存到CSV文件
```
这只是pandas的一些基础用法,实际应用中可以做更复杂的数据分析、合并、重塑等操作。
阅读全文