UnicodeDecodeError: 'gb18030' codec can't decode byte 0xbe in position 115: illegal multibyte sequence
时间: 2023-12-11 18:33:18 浏览: 69
gb18030编码
这个错误是因为Python默认使用的编码方式(gb18030)无法正确解码包含非ASCII字符的文件。可以尝试以下解决方案:
1.使用正确的编码方式打开文件,例如utf-8:
```python
with open('file.html', 'r', encoding='utf-8') as f:
html = f.read()
```
2.在读取文件时忽略错误:
```python
with open('file.html', 'r', errors='ignore') as f:
html = f.read()
```
3.尝试使用chardet库自动检测文件编码方式:
```python
import chardet
with open('file.html', 'rb') as f:
result = chardet.detect(f.read())
html = f.read().decode(result['encoding'])
```
阅读全文