正则表达式 保留字母数字汉字
时间: 2023-07-10 18:14:08 浏览: 181
Java正则表达式过滤出字母、数字和中文
可以使用以下正则表达式来匹配保留字母数字汉字:
```python
import re
text = "Hello, 你好,1234!"
pattern = re.compile(r'[\w\u4e00-\u9fa5]+')
match = pattern.findall(text)
print(match)
```
输出结果为:`['Hello', '你好', '1234']`
解释一下:
- `[]`:表示一个字符集合,里面的字符可以按照任意顺序出现。
- `\w`:表示匹配任意一个字母或数字,等价于`[a-zA-Z0-9]`。
- `\u4e00-\u9fa5`:表示匹配所有汉字,即Unicode编码中的中文字符范围。
- `+`:表示匹配前面的字符集合至少出现一次,可以匹配多次。
因此,`[\w\u4e00-\u9fa5]+`就表示匹配所有字母、数字和汉字,且至少出现一次。在上面的例子中,使用`re.findall()`函数找到了所有匹配的结果。
阅读全文