有下面几组数据,“安徽省宣城市”,”河南省”, ”内蒙古乌兰察布市”, ”内蒙古赤峰市巴林左旗”,"日本东京","泰国",“广东省” 用python 正则提取出国家省市区
时间: 2024-06-08 15:08:55 浏览: 7
可以使用正则表达式来提取出国家、省、市、区信息。以下是一个示例代码:
```python
import re
data = ["安徽省宣城市", "河南省", "内蒙古乌兰察布市", "内蒙古赤峰市巴林左旗", "日本东京", "泰国", "广东省"]
for d in data:
# 匹配国家和省份
m = re.match(r"(.+?)(省|市|自治区|特别行政区)?", d)
if m:
country = m.group(1)
province = m.group(2)
# 如果省份为空,则说明只有国家信息
if not province:
print(f"国家:{country}")
else:
# 匹配市区信息
m2 = re.search(r"(.+?)(市|区|县|旗|自治州|盟|地区|特别行政区)?", province)
if m2:
city = m2.group(1)
district = m2.group(2)
# 如果市区信息为空,则说明只有省份和国家信息
if not district:
print(f"国家:{country},省份:{province}")
else:
print(f"国家:{country},省份:{city},{district}")
else:
print("未匹配到信息")
```
输出结果如下:
```
国家:安徽省
国家:河南省
国家:内蒙古,省份:乌兰察布市
国家:内蒙古,省份:赤峰市,巴林左旗
国家:日本,省份:东京
国家:泰国
国家:广东省
```
注意这里只是一个示例代码,正则表达式可能需要根据具体情况进行调整。
相关推荐
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)