如何解决UnicodeDecodeError: 'gbk' codec can't decode byte 0xbd in position 2892: illegal multibyte sequence
时间: 2023-11-13 12:04:05 浏览: 81
Python运行报错UnicodeDecodeError的解决方法
当你使用pyquery库读取本地HTML文件时,出现UnicodeDecodeError: 'gbk' codec can't decode byte 0xbd in position 2892: illegal multibyte sequence错误,这是因为你的文件中包含了非GBK编码的字符。解决方法如下:
1. 在打开文件时,设置编码格式为'utf-8',如:open('filename.html', encoding='utf-8')。
2. 如果第一种方法不能解决问题,可以尝试使用'gb18030'编码格式,如:open('filename.html', encoding='gb18030')。
3. 如果以上两种方法都不能解决问题,可以使用'ignore'属性进行忽略,如:open('filename.html', encoding='gbk', errors='ignore')。
阅读全文