在不规则的文本中,提取ABC2023后面的所有字段,并以:作为分列符号。写出Python脚本
时间: 2023-05-28 19:02:13 浏览: 79
python针对不定分隔符切割提取字符串的方法
假设不规则文本为字符串text,可以使用正则表达式和re模块提取ABC2023后面的所有字段,然后使用split()方法以:作为分列符号进行分列。具体的Python脚本如下:
```python
import re
text = 'Some text ABC2023: field1, ABC2023: field2, XYZ: field3, ABC2023: field4'
# 提取ABC2023后面的所有字段
matches = re.findall(r'ABC2023: (.*?)(?=,|$)', text)
# 以:作为分列符号进行分列
for match in matches:
columns = match.split(':')
print(columns)
```
运行结果为:
```
['field1']
['field2']
['field4']
```
阅读全文