pandas筛选数据
时间: 2023-06-29 15:12:49 浏览: 106
在pandas中,可以使用布尔索引来筛选数据。布尔索引是一种根据某些条件过滤数据的技术,它的核心思想是通过一个条件表达式得到一个布尔值数组,然后将该数组传递给DataFrame,以获取与布尔值为True的行相关的数据。
下面是一些常用的筛选数据的方法:
1. 使用单个条件筛选数据
```python
df[df['column_name'] condition]
```
其中,condition是一个条件表达式,例如:
```python
df[df['age'] > 30] # 筛选出age列大于30的行
```
2. 使用多个条件筛选数据
```python
df[(df['column_name1'] condition1) & (df['column_name2'] condition2)]
```
例如:
```python
df[(df['age'] > 30) & (df['gender'] == 'male')] # 筛选出age大于30且gender为male的行
```
3. 使用isin()方法筛选数据
```python
df[df['column_name'].isin([value1, value2, ...])]
```
例如:
```python
df[df['city'].isin(['Beijing', 'Shanghai'])] # 筛选出居住在北京或上海的行
```
4. 使用str.contains()方法筛选数据
```python
df[df['column_name'].str.contains('substring')]
```
例如:
```python
df[df['name'].str.contains('John')] # 筛选出姓名中包含John的行
```
这些方法只是pandas中筛选数据的一部分,还有其他更多的方法可以用于数据筛选。
阅读全文