python利用正则表达式提取字符串后存入excel
时间: 2023-07-30 16:06:46 浏览: 144
python中使用正则表达式
您可以使用Python的`re`模块来利用正则表达式提取字符串,并使用`pandas`库将提取的结果存入Excel文件。以下是一个示例代码:
```python
import re
import pandas as pd
# 定义正则表达式模式
pattern = r'(\d+)\s+(\w+)\s+(\w+)'
# 示例字符串
text = "123 abc def\n456 ghi jkl\n789 mno pqr"
# 使用正则表达式匹配字符串
matches = re.findall(pattern, text)
# 创建DataFrame对象保存提取结果
df = pd.DataFrame(matches, columns=["Number", "String1", "String2"])
# 将DataFrame保存为Excel文件
df.to_excel("output.xlsx", index=False)
```
在上述代码中,我们首先定义了一个正则表达式模式,该模式可以匹配包含数字、字母和空格的字符串。然后,我们使用`re.findall()`函数在示例字符串中匹配所有符合模式的子字符串,并将结果保存在`matches`变量中。接下来,我们使用`pandas`库创建一个DataFrame对象,将提取结果存入其中,并指定列名。最后,我们使用DataFrame的`to_excel()`方法将数据保存到名为"output.xlsx"的Excel文件中。
请注意,在运行此代码之前,您需要先安装必要的依赖库,可以使用以下命令进行安装:
```
pip install pandas
```
希望这可以帮助到您!如果您有任何其他问题,请随时提问。
阅读全文