padnas列中内容正则表达式筛选
时间: 2023-06-29 12:09:15 浏览: 89
python 用正则表达式筛选文本信息的实例
假设你有一个 Pandas DataFrame,里面有一列数据需要用正则表达式筛选。以下是一个例子:
```python
import pandas as pd
# 创建一个 DataFrame
data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Emily'],
'email': ['alice@gmail.com', 'bob@yahoo.com', 'charlie@hotmail.com', 'david@hotmail.com', 'emily@gmail.com']}
df = pd.DataFrame(data)
# 使用正则表达式筛选 email 列中以 gmail.com 结尾的邮件
filtered_df = df[df['email'].str.contains(r'gmail\.com$')]
# 输出筛选后的结果
print(filtered_df)
```
输出结果为:
```
name email
0 Alice alice@gmail.com
4 Emily emily@gmail.com
```
在上面的代码中,`df['email'].str.contains(r'gmail\.com$')` 会返回一个布尔值的 Series,其中包含是否以 `gmail.com` 结尾的信息。我们将这个 Series 作为索引,就可以筛选出符合条件的行了。
阅读全文