python处理中文txt文本标点符号
时间: 2023-10-14 11:04:47 浏览: 181
Python处理中文标点符号大集合
5星 · 资源好评率100%
在Python中,可以使用正则表达式库re来处理中文txt文本中的标点符号。下面是一个示例代码:
```python
import re
# 定义正则表达式,匹配中文标点符号
pattern = re.compile('[^\u4e00-\u9fa5^a-z^A-Z^0-9]')
# 打开txt文件
with open('text.txt', 'r', encoding='utf-8') as f:
content = f.read()
# 使用正则表达式替换中文标点符号为空格
content = pattern.sub(' ', content)
# 输出处理后的文本
print(content)
```
在上面的代码中,首先定义了一个正则表达式,用于匹配中文标点符号。然后打开txt文件,读取其中的内容。接着使用re.sub()函数将匹配到的中文标点符号替换为空格。最后输出处理后的文本。
阅读全文