UnicodeDecodeError: 'utf-8' codec can't decode bytes in position 7970-7971: invalid continuation byte
时间: 2023-09-29 16:02:34 浏览: 76
这个报错通常是由于读取文件时使用了不正确的编码方式导致的。主要有两个可能的原因:一个是文件的实际编码与指定的编码方式不一致,另一个是文件中包含了无效的字节序列。解决这个问题的方法有以下几种:
1. 指定正确的编码方式:你可以尝试使用其他编码方式来读取文件,比如gbk或者latin-1等。在Python的`read_csv()`方法中,通常可以使用`encoding`参数来指定编码方式。你可以尝试不同的编码方式,直到找到适用的方式。
2. 忽略错误的字节序列:如果你确定文件中只有少量的无效字节序列,你可以尝试在`read_csv()`方法中使用`errors`参数来忽略这些错误。你可以设置`errors='ignore'`来跳过错误的字节序列。
3. 对字符串进行编码和解码:在某些情况下,你可以尝试先将字符串编码成二进制,然后再解码成正确的编码方式。比如使用`'张俊'.encode('utf-8').decode('utf-8')`来重新编码和解码字符串。
总的来说,解决这个报错的关键是找到正确的编码方式,并确保文件中不包含无效的字节序列。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *2* *3* [UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte xx in position xx: invalid continuation byte](https://blog.csdn.net/weixin_43718742/article/details/121992195)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"]
[ .reference_list ]
阅读全文