正则表达式去除非汉字
时间: 2023-11-07 21:06:33 浏览: 145
正则表达式中\w不能识别中文
可以使用正则表达式来去除非汉字字符。下面是一个示例的正则表达式,可以用来匹配非汉字字符:
```python
import re
text = "Hello 你好!1234"
result = re.sub(r"[^\u4e00-\u9fa5]", "", text)
print(result)
```
输出结果为:"你好"
这个正则表达式中,`[^\u4e00-\u9fa5]` 表示匹配除了 Unicode 编码范围内的汉字以外的字符。`re.sub()` 函数将匹配到的字符替换为空字符串,从而去除非汉字字符。
阅读全文