pandas报错 'gbk' codec can't decode byte 0x8b in position 123: illegal multibyte sequence
时间: 2023-10-30 07:59:43 浏览: 174
python爬取表格 ‘gbk’ codec can’t encode character ‘\U0001f370’ in position 5: illegal multibyte sequence
5星 · 资源好评率100%
这个报错是因为你的代码在读取文件时遇到了gbk编码问题,无法解析其中的某些字节序列。这种错误通常是因为文件的编码与你的代码所期望的编码不一致导致的。
解决这个问题有几种方法:
1. 将文件编码改为UTF-8。你可以使用文本编辑器打开文件,并将其另存为UTF-8编码。这样,当你的代码读取文件时,就可以正确地解析其中的中文字符了。
2. 在代码中指定文件的编码。你可以使用Python的open函数的encoding参数来指定文件的编码。例如,你可以使用'rb'模式打开文件,并在读取行时使用.decode('utf-8')方法来将其解码为字符串。
3. 使用pandas库的read_csv函数时,可以通过设置encoding参数为'utf-8'来指定文件的编码。例如,可以使用pandas.read_csv(path, encoding='utf-8')来读取文件。
综上所述,你可以尝试使用以上方法之一来解决这个问题。希望能帮到你!
阅读全文