pandas常用指令
时间: 2024-01-22 18:16:42 浏览: 140
pandas常用函数
以下是一些常用的Pandas指令:
1. 导入模块:
```python
import pandas as pd
import numpy as np
```
2. 读取数据和保存数据:
```python
# 读取CSV文件
data = pd.read_csv('data.csv')
# 保存数据到CSV文件
data.to_csv('new_data.csv', index=False)
```
3. 查看数据:
```python
# 查看前几行数据,默认为前5行
data.head()
# 查看后几行数据,默认为后5行
data.tail()
# 查看数据的基本信息
data.info()
# 查看数据的统计摘要
data.describe()
```
4. 数据选择和过滤:
```python
# 选择某一列数据
column_data = data['column_name']
# 选择多列数据
multiple_columns_data = data[['column1', 'column2']]
# 根据条件过滤数据
filtered_data = data[data['column'] > 10]
# 使用逻辑运算符过滤数据
filtered_data = data[(data['column1'] > 10) & (data['column2'] < 20)]
```
5. 数据排序:
```python
# 按照某一列升序排序
sorted_data = data.sort_values('column')
# 按照某一列降序排序
sorted_data = data.sort_values('column', ascending=False)
```
6. 数据分组和聚合:
```python
# 按照某一列进行分组,并计算每组的平均值
grouped_data = data.groupby('column').mean()
# 按照多列进行分组,并计算每组的总和
grouped_data = data.groupby(['column1', 'column2']).sum()
```
7. 数据合并和连接:
```python
# 按照某一列进行合并
merged_data = pd.merge(data1, data2, on='column')
# 按照索引进行连接
joined_data = data1.join(data2)
```
8. 缺失值处理:
```python
# 检查缺失值
data.isnull()
# 删除包含缺失值的行
data.dropna()
# 填充缺失值
data.fillna(value)
```
9. 数据可视化:
```python
# 绘制柱状图
data.plot.bar(x='column1', y='column2')
# 绘制折线图
data.plot.line(x='column1', y='column2')
# 绘制散点图
data.plot.scatter(x='column1', y='column2')
```
阅读全文