utf-8' codec can't decode byte 0x87 in position 10: invalid start byte出现这个报错
时间: 2023-09-24 14:13:18 浏览: 88
Java 程序转码(UTF-8)
4星 · 用户满意度95%
这个错误通常是由于文件的实际编码与你尝试使用的编码不匹配导致的。你可以尝试以下方法来解决这个问题:
1. 指定正确的编码:尝试使用文件的实际编码来打开文件。可以尝试使用 'utf-8-sig'、'latin-1'、'gbk' 等常见编码进行尝试。
```python
df = pd.read_csv(r'选题3数据集.csv', encoding='utf-8-sig')
```
2. 检查文件完整性:确保文件没有损坏。你可以尝试重新下载文件,或者使用其他软件打开文件来确认文件是否能够正确打开。
3. 使用错误处理机制:在解码时,可以指定错误处理机制,以便在遇到无效字节时继续解码。例如,可以使用 'utf-8' 编码的 `decode()` 方法,指定参数 `errors='ignore'` 来忽略无效字节。
```python
df = pd.read_csv(r'选题3数据集.csv', encoding='utf-8', errors='ignore')
```
如果以上方法仍然无法解决问题,请提供更多的上下文信息,例如完整的错误消息、数据示例或其他相关代码,以便我能够更好地帮助你解决问题。
阅读全文