python 分离句子的汉子和数字
时间: 2023-06-10 12:03:32 浏览: 149
python实现字符串和数字拼接
可以使用Python中的正则表达式模块re来实现。
示例代码:
```
import re
text = "今天是2022年5月1日,天气很好。"
pattern = r'([\u4e00-\u9fa5]+)|(\d+)'
result = re.findall(pattern, text)
print(result)
```
输出结果:
```
[('今天是', ''), ('年', '2022'), ('月', '5'), ('日', '1'), (',天气很好。', '')]
```
其中,`pattern`是一个正则表达式,`([\u4e00-\u9fa5]+)`表示匹配中文字符,`(\d+)`表示匹配数字。`re.findall()`函数可以返回所有匹配的结果。
上述代码中,我们将中文字符和数字分别用括号括起来,这样`re.findall()`函数会将每个匹配结果以元组的形式返回。我们可以通过遍历元组来提取中文字符和数字。
注意:中文字符在Unicode编码中的范围是`[\u4e00-\u9fa5]`。如果要匹配其他语言的字符,需要修改正则表达式中的范围。
阅读全文