读取csv报错UnicodeDecodeError: 'utf-8' codec can't decode byte 0x91 in position 15: invalid start byte
时间: 2023-08-31 12:39:31 浏览: 155
### 回答1:
这个错误表示在读取csv文件时出现了问题,因为在第15个位置上的字节无法使用utf-8编码进行解码,导致了UnicodeDecodeError错误。
可能的原因是文件中包含了非utf-8编码的字符,因此需要使用其他编码方式来读取文件,或者将文件中的非utf-8编码字符转换为utf-8编码。
您可以尝试使用不同的编码方式,例如gbk、gb2312等,来读取该文件。如果您不知道文件的编码方式,可以尝试使用文本编辑器打开文件并查看编码方式。另外,您也可以尝试在读取csv文件时指定编码方式,例如:
```
import pandas as pd
df = pd.read_csv('filename.csv', encoding='gbk')
```
希望这可以帮助您解决问题!
### 回答2:
这个错误通常是由于读取CSV文件时编码格式不匹配引起的。
CSV文件是一种以文本形式存储数据的文件格式,其中的内容可以是任何字符,包括特殊字符和非ASCII字符。在读取CSV文件时,需要确保使用与文件编码格式相同的编码方式进行读取,否则就会出现UnicodeDecodeError错误。
根据报错信息可以看出,在读取第15个位置时,遇到了一个无效的起始字节0x91。这意味着这个字节无法通过UTF-8编码进行解码。
要解决这个问题,有以下几种方法:
1. 指定正确的编码方式:尝试使用其他编码方式进行读取,如GBK、GB2312等。可以通过指定encoding参数来实现,如`df = pd.read_csv('filename.csv', encoding='GBK')`。
2. 使用更通用的编码方式:UTF-8是一种通用的编码方式,大多数情况下都可以正常读取CSV文件。可以通过指定errors参数为'ignore',忽略无法解码的字节,如`df = pd.read_csv('filename.csv', encoding='utf-8', errors='ignore')`。
3. 手动处理文件编码问题:如果尝试了以上方法仍然无法解决问题,可能需要手动处理文件编码问题。可以使用一个文本编辑器打开CSV文件,然后将文件编码另存为UTF-8格式,然后再尝试读取。
无论哪种方法,都需要确保选择正确的编码方式,以便成功读取CSV文件中的内容。
阅读全文
相关推荐



















