dataframe筛选数据
时间: 2023-08-31 11:12:23 浏览: 95
数据筛选程序
数据筛选是DataFrame中最常用的操作之一,可以通过多种方法进行筛选,包括行筛选、列筛选、多条件筛选等。
1. 行筛选
行筛选可以通过多种方法实现,包括使用布尔索引、使用loc和iloc方法等。
使用布尔索引:
```python
import pandas as pd
# 创建DataFrame
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie', 'David', 'Eva'],
'age': [20, 25, 30, 35, 40]})
# 使用布尔索引筛选年龄大于30的行
df[df['age'] > 30]
# 输出结果:
# name age
# 3 David 35
# 4 Eva 40
```
使用loc方法:
```python
# 使用loc方法筛选年龄大于30的行
df.loc[df['age'] > 30]
# 输出结果:
# name age
# 3 David 35
# 4 Eva 40
```
使用iloc方法:
```python
# 使用iloc方法筛选索引号大于等于3的行
df.iloc[3:]
# 输出结果:
# name age
# 3 David 35
# 4 Eva 40
```
2. 列筛选
列筛选可以通过直接使用列名或使用loc方法实现。
直接使用列名:
```python
# 筛选name列
df['name']
# 输出结果:
# 0 Alice
# 1 Bob
# 2 Charlie
# 3 David
# 4 Eva
# Name: name, dtype: object
```
使用loc方法:
```python
# 筛选name和age列
df.loc[:, ['name', 'age']]
# 输出结果:
# name age
# 0 Alice 20
# 1 Bob 25
# 2 Charlie 30
# 3 David 35
# 4 Eva 40
```
3. 多条件筛选
多条件筛选可以通过使用&和|符号实现。
```python
# 筛选年龄大于30且姓名为David的行
df[(df['age'] > 30) & (df['name'] == 'David')]
# 输出结果:
# name age
# 3 David 35
```
以上就是DataFrame中常用的数据筛选方法。
阅读全文