python编程:打开一个文本文件,将html编码转换为中文,并另存
时间: 2023-06-17 17:06:21 浏览: 102
文本文件编码转换
可以使用Python内置的`codecs`模块来打开文本文件,并指定编码方式。然后可以使用`html`模块中的`unescape`函数将HTML编码转换为中文,最后将转换后的文本保存到新的文件中。
以下是示例代码:
```python
import codecs
import html
# 打开原始文件
with codecs.open('original_file.html', 'r', 'utf-8') as f:
# 读取文件内容
content = f.read()
# 将HTML编码转换为中文
decoded_content = html.unescape(content)
# 打开目标文件
with codecs.open('converted_file.txt', 'w', 'utf-8') as f:
# 将转换后的内容写入文件
f.write(decoded_content)
```
在此示例中,我们将原始文件命名为`original_file.html`,在代码中使用`codecs.open`函数以UTF-8编码打开文件。读取文件内容后,我们使用`html.unescape`函数将HTML编码转换为中文。最后,我们打开一个新的文件`converted_file.txt`,并使用相同的编码方式将转换后的内容写入文件中。
阅读全文