正则表达去除非汉字字符和空白字符的python代码
时间: 2024-02-04 12:09:33 浏览: 24
可以使用正则表达式来去除非汉字字符和空白字符。下面是一个示例代码:
```python
import re
def remove_non_chinese_and_whitespace(text):
pattern = r'[^\u4e00-\u9fa5\s]'
cleaned_text = re.sub(pattern, '', text)
return cleaned_text
# 示例用法
text = 'Hello 你好 123#@!'
cleaned_text = remove_non_chinese_and_whitespace(text)
print(cleaned_text) # 输出:你好
```
在上面的代码中,我们使用了正则表达式的`[^\u4e00-\u9fa5\s]`模式来匹配非汉字字符和空白字符。`[^\u4e00-\u9fa5]`表示匹配除了汉字之外的字符,`\s`表示匹配空白字符(包括空格、制表符、换行符等)。`re.sub()`函数用于替换匹配到的字符为空字符串,从而实现去除非汉字字符和空白字符的效果。