如何用pandas的extract函数使用正则表达式匹配多条数据
时间: 2023-06-05 07:06:15 浏览: 304
使用正则表达式取出数据
这个问题可以回答。使用pandas的extract函数可以通过对字符串进行正则表达式匹配,提取字符串中符合要求的子串。可以使用正则表达式中的()组合来匹配多条数据,然后通过在函数中指定expand为True来将结果提取到DataFrame的多个新列中。例如:
import pandas as pd
data = {'name': ['John', 'Jane', 'Steve', 'Mike'],
'address': ['123 Main St, New York', '456 Oak Ave, Los Angeles', '789 Elm St, San Francisco', '910 Pine St, Seattle']}
df = pd.DataFrame(data)
df[['street', 'city']] = df['address'].str.extract(r'([0-9]+)\s+([A-Za-z\s]+)', expand=True)
这段代码将会在原有的DataFrame中添加两列,即street和city,这两列分别是从address中提取出来的符合要求的子串。
阅读全文