UnicodeDecodeError: 'gbk' codec can't decode byte 0x95 in position 22: illegal multibyte sequence
时间: 2023-10-22 15:28:10 浏览: 154
当你使用pyquery库读取本地HTML文件时,出现UnicodeDecodeError: 'gbk' codec can't decode byte 0x95 in position 22: illegal multibyte sequence的错误,这个错误通常是由于编码方式不匹配导致的。编码方式指定了如何将字节序列转换成Unicode字符。
根据引用和引用的内容,这个错误可能是因为你的HTML文件包含了非法的多字节序列,而你正在使用的编码方式(gbk)无法正确解码这个字节序列。为了解决这个问题,你可以尝试修改编码方式为utf-8。
你可以使用类似引用中提到的方法,将打开文件的代码修改为:
with open(file, 'r', encoding='utf-8') as f:
这样可以使用utf-8编码方式读取文件,避免了UnicodeDecodeError错误。你可以根据自己的情况修改代码中的文件路径和变量名。
希望这个解决方案对你有帮助!<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* [pyquery报错:UnicodeDecodeError: ‘gbk’ codec can’t decode byte](https://download.csdn.net/download/weixin_38665944/13751270)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"]
- *2* *3* [Python报错UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte](https://blog.csdn.net/sweet_tea_/article/details/125372604)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"]
[ .reference_list ]
阅读全文