python读取txt文件每一行且每一行只保留中文
时间: 2023-08-16 16:07:21 浏览: 335
您可以使用Python的正则表达式模块re来实现这个需求。下面是一个例子,演示如何读取一个txt文件的每一行,并且只保留其中的中文字符:
```python
import re
def extract_chinese(text):
pattern = re.compile(r'[\u4e00-\u9fa5]+') # 匹配中文字符的正则表达式
chinese_text = pattern.findall(text) # 提取中文字符
return ''.join(chinese_text) # 将提取到的中文字符拼接成字符串
filename = 'example.txt' # 替换为您的txt文件路径和文件名
with open(filename, 'r', encoding='utf-8') as file:
for line in file:
chinese_line = extract_chinese(line)
print(chinese_line)
```
在上述代码中,我们首先定义了一个名为extract_chinese的函数,该函数使用正则表达式匹配中文字符,并将其提取出来。然后,我们打开指定的txt文件,并逐行读取文件内容。对于每一行,我们调用extract_chinese函数提取其中的中文字符,并将提取到的中文字符打印出来。
请注意,您需要将`filename`变量替换为您实际的txt文件路径和文件名,并根据实际情况修改文件的编码方式(在示例中使用了utf-8编码)。
阅读全文