pandas字符串模糊筛选
时间: 2024-12-10 16:11:45 浏览: 10
pandas factorize实现将字符串特征转化为数字特征
在pandas中,字符串模糊筛选通常使用`str.contains()`方法来实现。这个方法允许你根据指定的模式对字符串进行匹配,并且可以使用正则表达式来定义复杂的匹配规则。
以下是一个简单的例子,展示了如何使用`str.contains()`方法进行字符串模糊筛选:
```python
import pandas as pd
# 创建一个示例DataFrame
data = {
'name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'],
'age': [24, 27, 22, 32, 29]
}
df = pd.DataFrame(data)
# 使用str.contains进行模糊筛选,匹配包含'li'的字符串
filtered_df = df[df['name'].str.contains('li', case=False, na=False)]
print(filtered_df)
```
在这个例子中,`str.contains('li', case=False, na=False)`会匹配所有包含'li'的字符串,`case=False`表示不区分大小写,`na=False`表示如果遇到缺失值则返回False。
阅读全文