UnicodeDecodeError: 'gbk' codec can't decode byte 0x98 in position 49: incomplete multibyte sequence
时间: 2023-11-04 11:57:28 浏览: 124
pyquery报错:UnicodeDecodeError: ‘gbk’ codec can’t decode byte
5星 · 资源好评率100%
UnicodeDecodeError: 'gbk'编解码器无法解码字节0xa1,位置164:非法的多字节序列。这个错误通常是因为在使用pyquery库读取本地HTML文件时,编码格式不匹配导致的。具体原因是你的HTML文件采用了GBK编码,而pyquery库默认使用的是UTF-8编码。为了解决这个问题,你可以在读取HTML文件时指定正确的编码格式,例如:
```
from pyquery import PyQuery as pq
with open('your_file.html', 'r', encoding='gbk') as f:
html = f.read()
doc = pq(html)
```
这样就能够正确读取HTML文件并避免UnicodeDecodeError错误的发生。
阅读全文