首页'utf-8' codec can't decode byte 0xb9 in position 0: invalid start byte

'utf-8' codec can't decode byte 0xb9 in position 0: invalid start byte

时间: 2023-08-02 15:07:40 浏览: 213

这个报错是由于Panda读取csv文件时遇到了编码问题导致的。具体来说，报错信息中的'utf-8' codec can't decode byte 0xb9 in position 0: invalid start byte表示在文件的第一个字节位置上遇到了无效的起始字节，无法使用utf-8编码进行解码。[1]

这个问题的原因是，当浏览器访问网页时，会自动解压缩从服务器返回的gzip压缩的网页，因此不会出现乱码。但是在我们编写的代码中，没有自动解码，将压缩后的数据当做普通的html文本来处理，导致出现乱码。[2]

要解决这个问题，可以在读取csv文件时指定正确的编码方式。例如，可以使用encoding参数将编码设置为"gbk"，这是一种常用的中文编码方式。具体代码如下所示：

import pandas as pd
df = pd.read_csv("医院匹配.csv", encoding="gbk")
print(df.info())

通过将编码设置为"gbk"，可以正确地读取csv文件并避免乱码问题。[3]

引用[.reference_title]

1 3 UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xb9 in position 0: invalid start byte[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~~all~~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item]
2 UnicodeDecodeError: utf-8 codec can t decode byte 0x8b in position 1: invalid start byte[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~~all~~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]