pandas loc 条件筛选
时间: 2023-05-09 19:01:39 浏览: 112
pandas loc 是一个基于标签定位数据的函数,它可以让我们方便地使用标签(或布尔数组)筛选数据。在使用 loc 进行条件筛选时,我们可以使用比较运算符(如 >、<、==、!=、>=、<=)、逻辑运算符(如 &、|、~)和 df.isin() 方法来构建筛选条件。下面是一个示例:
```
import pandas as pd
# 创建一个示例 DataFrame
data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Emma'],
'age': [25, 30, 35, 40, 45],
'salary': [5000, 7000, 9000, 11000, 13000]}
df = pd.DataFrame(data)
# 筛选出年龄大于等于35岁且薪水高于8000的员工
selected_data = df.loc[(df.age >= 35) & (df.salary > 8000)]
print(selected_data)
```
运行结果:
```
name age salary
2 Charlie 35 9000
3 David 40 11000
4 Emma 45 13000
```
在上面的例子中,我们使用了 & 运算符将两个条件组合起来,然后使用 loc 方法对数据进行筛选。值得注意的是,loc 方法还可以使用切片来选取数据,例如:
```
# 选取前两行数据
selected_data = df.loc[:1]
# 选取第三行数据
selected_data = df.loc[2]
# 选取第三列数据
selected_data = df.loc[:, 'salary']
```
综上所述,pandas loc 方法可以方便地进行条件筛选和标签定位数据,是 pandas 库中非常实用的一个函数。
阅读全文