'utf-8' codec can't decode byte 0xb9 in position 0: invalid start byte
时间: 2023-08-02 07:07:40 浏览: 194
Zenmap 报’utf8′ codec can’t decode byte 0xc0 in position 0: invalid start byte错误部分解决方案
这个报错是由于Panda读取csv文件时遇到了编码问题导致的。具体来说,报错信息中的'utf-8' codec can't decode byte 0xb9 in position 0: invalid start byte表示在文件的第一个字节位置上遇到了无效的起始字节,无法使用utf-8编码进行解码。\[1\]
这个问题的原因是,当浏览器访问网页时,会自动解压缩从服务器返回的gzip压缩的网页,因此不会出现乱码。但是在我们编写的代码中,没有自动解码,将压缩后的数据当做普通的html文本来处理,导致出现乱码。\[2\]
要解决这个问题,可以在读取csv文件时指定正确的编码方式。例如,可以使用encoding参数将编码设置为"gbk",这是一种常用的中文编码方式。具体代码如下所示:
```python
import pandas as pd
df = pd.read_csv("医院匹配.csv", encoding="gbk")
print(df.info())
```
通过将编码设置为"gbk",可以正确地读取csv文件并避免乱码问题。\[3\]
#### 引用[.reference_title]
- *1* *3* [UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xb9 in position 0: invalid start byte](https://blog.csdn.net/FriendshipTang/article/details/113897473)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item]
- *2* [UnicodeDecodeError: utf-8 codec can t decode byte 0x8b in position 1: invalid start byte](https://blog.csdn.net/m0_52613986/article/details/129739448)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item]
[ .reference_list ]
阅读全文