Python 清除文件中的中文标点符号,只保留中文,英文,数字等字符,将结果输出到文件clean.txt中
时间: 2024-03-16 16:41:34 浏览: 286
Python处理中文标点符号大集合
5星 · 资源好评率100%
可以使用正则表达式来实现这个功能。下面是一个 Python 代码示例:
```python
import re
# 打开原始文件和清理后的文件
with open('original.txt', 'r', encoding='utf-8') as f1, open('clean.txt', 'w', encoding='utf-8') as f2:
# 读取原始文件中的所有内容
text = f1.read()
# 使用正则表达式清除中文标点符号
cleaned_text = re.sub('[^\u4e00-\u9fa5a-zA-Z0-9\n\s]', '', text)
# 将清理后的内容写入到清理后的文件中
f2.write(cleaned_text)
```
这段代码将会打开名为 `original.txt` 的文件,将其中的中文标点符号清除,并将结果输出到名为 `clean.txt` 的文件中。你可以修改文件名和路径来适应你的需要。
阅读全文