UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 28: illegal multibyte sequence
时间: 2023-11-20 20:55:49 浏览: 18
pyquery报错:UnicodeDecodeError: ‘gbk’ codec can’t decode byte
5星 · 资源好评率100%
这个错误是因为Python默认使用的编码方式(GBK)无法正确解码包含非ASCII字符的文件。可以尝试以下解决方案:
1.使用正确的编码方式打开文件,例如UTF-8:
```python
with open('file.html', 'r', encoding='utf-8') as f:
html = f.read()
```
2.在读取文件时忽略错误:
```python
with open('file.html', 'r', errors='ignore') as f:
html = f.read()
```
3.使用chardet库自动检测文件编码方式:
```python
import chardet
with open('file.html', 'rb') as f:
result = chardet.detect(f.read())
html = open('file.html', 'r', encoding=result['encoding']).read()
```
阅读全文