首页padnas列中内容正则表达式筛选

padnas列中内容正则表达式筛选

时间: 2023-06-29 10:09:15 浏览: 91

假设你有一个 Pandas DataFrame，里面有一列数据需要用正则表达式筛选。以下是一个例子： ```python import pandas as pd # 创建一个 DataFrame data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Emily'], 'email': ['alice@gmail.com', 'bob@yahoo.com', 'charlie@hotmail.com', 'david@hotmail.com', 'emily@gmail.com']} df = pd.DataFrame(data) # 使用正则表达式筛选 email 列中以 gmail.com 结尾的邮件 filtered_df = df[df['email'].str.contains(r'gmail\.com$')] # 输出筛选后的结果 print(filtered_df) ``` 输出结果为： ``` name email 0 Alice alice@gmail.com 4 Emily emily@gmail.com ``` 在上面的代码中，`df['email'].str.contains(r'gmail\.com$')` 会返回一个布尔值的 Series，其中包含是否以 `gmail.com` 结尾的信息。我们将这个 Series 作为索引，就可以筛选出符合条件的行了。

阅读全文