匹配中文的正则表达式 python
时间: 2023-06-21 21:10:06 浏览: 53
在 Python 中,可以使用 re 模块来实现正则表达式匹配。中文的正则表达式与英文的正则表达式基本一致,只需要考虑中文字符的编码问题。
以下是一些常见的中文正则表达式示例:
1. 匹配中文字符: [\u4e00-\u9fa5]
2. 匹配中文、英文、数字: [\u4e00-\u9fa5a-zA-Z0-9]
3. 匹配中文标点符号: [\u3000-\u303f]
4. 匹配中文及中文标点符号: [\u3000-\u303f\u4e00-\u9fa5]
示例代码:
```python
import re
text = "你好,世界!Hello, world! 123456。"
pattern = '[\u4e00-\u9fa5]+' # 匹配中文字符
result = re.findall(pattern, text)
print(result)
pattern = '[\u4e00-\u9fa5a-zA-Z0-9]+' # 匹配中文、英文、数字
result = re.findall(pattern, text)
print(result)
pattern = '[\u3000-\u303f]+' # 匹配中文标点符号
result = re.findall(pattern, text)
print(result)
pattern = '[\u3000-\u303f\u4e00-\u9fa5]+' # 匹配中文及中文标点符号
result = re.findall(pattern, text)
print(result)
```
输出结果:
```
['你好', '世界']
['你好', '世界', 'Hello', 'world', '123456']
['。']
['你好', '世界', '。']
```