UnicodeDecodeError: 'gbk' codec can't decode byte 0xad in position 14: illegal multibyte sequence
时间: 2023-11-20 17:57:54 浏览: 38
关于GBK和Unicode字符集转换乱码问题
3星 · 编辑精心推荐
这个错误是因为Python默认使用的编码方式(GBK)无法正确解码包含非ASCII字符的文件。可以尝试以下解决方案:
1.使用正确的编码方式打开文件,例如UTF-8:
```python
with open('file.html', 'r', encoding='utf-8') as f:
html = f.read()
```
2.在读取文件时忽略错误:
```python
with open('file.html', 'r', errors='ignore') as f:
html = f.read()
```
3.使用chardet库自动检测文件编码方式:
```python
import chardet
with open('file.html', 'rb') as f:
result = chardet.detect(f.read())
html = open('file.html', 'r', encoding=result['encoding']).read()
```
阅读全文