郑群方 男 350322197605190510 混凝土工 高级工 福建省益丰建设工程有限 公司 用正则 分割保存表格
时间: 2024-09-13 16:07:32 浏览: 40
玉环益丰汽配有限公司质量手册范本.doc
您提供的信息是一个姓名加个人信息的格式,可以用正则表达式来分隔并保存到表格中。假设我们想要按照 "姓 + 名"、"出生日期"、职业、技能级别和公司等字段分隔,下面是一种简单的正则分割方法:
1. **姓氏和名字**:"郑群方" 可以直接提取,不需要正则匹配,直接字符串切分即可。
2. **出生日期**:"19760519",这是一个连续的数字序列,可以用正则表达式 `\d{4}\d{2}\d{2}` 匹配,然后提取出来。
3. **职业**:"混凝土工"
4. **技能级别**:"高级工"
5. **公司名**:"福建省益丰建设工程有限公司"
你可以使用Python的 `re` 模块来进行这样的分割:
```python
import re
data = "郑群方 350322197605190510 混凝土工 高级工 福建省益丰建设工程有限公司"
pattern = r"(\w+)(\s+\d{4}[\d]{2}[\d]{2})(\s+.+?)\s+(\S+?)\s+(\S.*)"
matches = re.findall(pattern, data)
# matches 将是一个列表,包含每个字段的元组
```
然后你可以将 `matches` 转换为你喜欢的数据结构,如字典或CSV格式,并保存到文件中。例如,转换成CSV:
```python
import csv
with open('output.csv', 'w', newline='', encoding='utf-8') as file:
writer = csv.writer(file)
writer.writerow(['姓名', '出生日期', '职业', '技能级别', '公司'])
for match in matches:
writer.writerow(match)
```
阅读全文