def read_file(file): """接收文件名为参数,将文件中的内容读为字符串, 只保留文件中的英文字母和西文符号, 过滤掉中文(中文字符及全角符号Unicode编码都大于256) 将所有字符转为小写, 将其中所有标点、符号替换为空格,返回字符串
时间: 2024-01-24 12:18:53 浏览: 144
python 文件对象,函数基础,模块基础
"""
with open(file, 'r', encoding='utf-8') as f:
content = f.read()
content = ''.join([c.lower() if ord(c) < 256 else ' ' for c in content])
content = re.sub(r'[^\w\s]', ' ', content)
return content
阅读全文