如何解决html = requests.get('http://www.kanunu8.com/book3/6879').content.decode() UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc4 in position 276: invalid continuation byte
时间: 2024-02-13 10:24:59 浏览: 191
python requests.get带header
这个错误是由于尝试使用UTF-8编码解码包含非UTF-8字符的内容而引起的。你可以尝试指定其他的编码格式来解决这个问题。
首先,你可以尝试使用`requests.get().text`来获取响应的文本内容,而不是使用`.content.decode()`。这样requests库会自动根据响应头中的字符编码进行解码。
```
html = requests.get('http://www.kanunu8.com/book3/6879').text
```
如果上述方法仍然无法解决问题,你可以尝试使用其他编码格式进行解码。例如,如果你知道该网页使用的是GBK编码,可以使用`.content.decode('gbk')`来解码。
```
html = requests.get('http://www.kanunu8.com/book3/6879').content.decode('gbk')
```
请根据实际情况尝试这些方法,并选择适合的编码格式来解决UnicodeDecodeError错误。
阅读全文