UnicodeDecodeError: 'gbk' codec can't decode byte 0x8c in position 546: illegal multibyte sequence
时间: 2023-11-04 18:57:52 浏览: 135
关于GBK和Unicode字符集转换乱码问题
3星 · 编辑精心推荐
UnicodeDecodeError: 'gbk'编解码器无法解码字节0x8c的位置62: 非法的多字节序列。 这个错误通常发生在使用pyquery库读取本地HTML文件时,因为默认的编码方式是GBK,而文件的编码方式是UTF-8。解决这个问题的方法很简单,只需要在打开文件的时候指定编码方式为UTF-8即可。修改前的代码是open(file_path, 'r'),应该修改为open(file_path, 'r', encoding='utf-8')。
阅读全文