pandas的用法
时间: 2023-06-30 11:17:48 浏览: 83
pandas的使用方法
Pandas 是一个用于数据分析的 Python 库,它提供了一种称为 DataFrame 的数据结构,可以方便地处理和分析二维表格数据。
以下是 Pandas 常用的用法:
1. 导入 Pandas 库:
```
import pandas as pd
```
2. 创建 DataFrame:
```
df = pd.DataFrame({'姓名': ['张三', '李四', '王五'],
'年龄': [18, 20, 22],
'性别': ['男', '男', '女']})
```
3. 查看数据:
```
# 查看前几行数据
df.head()
# 查看后几行数据
df.tail()
# 查看数据的行数和列数
df.shape
# 查看数据的基本信息
df.info()
# 查看数据的统计信息
df.describe()
```
4. 筛选数据:
```
# 选择指定列的数据
df[['姓名', '年龄']]
# 根据条件筛选数据
df[df['年龄'] > 18]
# 根据多个条件筛选数据
df[(df['年龄'] > 18) & (df['性别'] == '男')]
# 根据指定值筛选数据
df[df['姓名'].isin(['张三', '王五'])]
```
5. 修改数据:
```
# 修改指定列的值
df['年龄'] = [20, 22, 24]
# 添加新列
df['职业'] = ['学生', '工人', '教师']
# 删除指定列
df.drop('职业', axis=1, inplace=True)
```
6. 数据排序:
```
# 根据指定列进行升序排序
df.sort_values(by='年龄')
# 根据多列进行升序排序
df.sort_values(by=['年龄', '性别'])
# 根据指定列进行降序排序
df.sort_values(by='年龄', ascending=False)
```
7. 数据分组:
```
# 根据指定列进行分组
df.groupby('性别')
# 对分组后的数据进行聚合操作
df.groupby('性别').mean()
```
以上是 Pandas 的一些常用用法,还有很多其他的用法可以根据实际需求来使用。
阅读全文