df = pd.read_csv('data.csv', encoding='shift-jis') UnicodeDecodeError: 'shift_jis' codec can't decode byte 0x87 in position 38

时间: 2023-10-24 17:08:50 浏览: 206

读写CSV文件函数（代码）

4星 · 用户满意度95%

### 读写CSV文件函数（代码）的知识点详解 #### 一、背景介绍 CSV（Comma-Separated Values）是一种常见的数据交换格式，通常用于存储表格数据。它以纯文本形式存储数值和文本信息，每一行表示一个数据记录，记录中的字段由逗号分隔。在实际开发过程中，经常需要读取或写入CSV文件来处理数据。 #### 二、函数设计与实现本节将详细介绍如何实现读取和写入CSV文件的两个函数，并分析其内部实现细节。 ##### （一）读取CSV文件函数——`GetCSV` 1. **函数定义**： ```cpp void CSIMApp::GetCSV(CString strFileName) ``` 2. **参数说明**： - `strFileName`: CSV文件的路径名。 3. **功能概述**： - 该函数实现了从指定的CSV文件中读取数据，并按照一定的规则解析这些数据。 - 数据被解析后存储在自定义的数据结构中，便于后续处理。 4. **主要逻辑步骤**： - 使用`CStdioFile`类打开文件进行读取。 - 通过`CFile::modeRead`模式确保文件是只读的。 - 遍历文件内容，首先读取通道信息，然后读取设备信息。 - 对每条记录进行解析，并将解析后的数据存储在自定义的数据结构中。 5. **具体实现**： - **初始化变量**：定义了多个辅助变量，如`CString`类型的字符串变量以及整型变量，用于存储和计算数据。 - **打开文件**：通过`CStdioFile`类的`Open`方法尝试打开文件。如果打开失败，会捕获异常并给出错误提示。 - **读取通道信息**： - 通过循环读取文件，跳过前两行注释信息。 - 判断是否为通道信息的开始标记`!`。 - 逐行读取通道信息，并按逗号分隔符分割每一项，将其存储到自定义的`channel`结构体中。 - **读取设备信息**： - 在通道信息之后，判断是否到达设备信息的开始标记`@`。 - 类似于读取通道信息的方式，逐行读取设备信息，并将其存储到自定义的`dev`结构体中。 6. **自定义数据结构**： - **`channel`结构体**：包含通道名称、描述、IP地址、端口号和重试次数等属性。 - **`dev`结构体**：根据上下文推测，可能包含设备相关的属性。 7. **异常处理**： - 如果文件无法正常打开，则通过`CFileException`异常进行处理，并给出相应的错误提示。 - 如果在解析过程中出现格式错误，则通过`AfxMessageBox`函数弹出错误消息框。 ##### （二）注意事项 - **编码问题**：在读取文件时需要注意文件的编码格式，确保与程序一致。 - **文件路径**：正确设置文件路径，避免因路径问题导致文件无法打开。 - **错误处理**：对于文件操作中的各种异常情况，需要进行适当的错误处理，保证程序的健壮性。 - **内存管理**：在动态分配内存时，应注意释放不再使用的内存，避免内存泄漏。 #### 三、小结通过以上分析可以看出，这个函数实现了对特定格式CSV文件的读取，并能够按照预定义的规则解析数据。在实际应用中，这种能力非常有用，可以方便地读取和处理外部数据源。同时，我们也注意到该函数还有一些可以优化的地方，比如可以考虑增加更全面的错误处理机制、支持不同格式的CSV文件等。

这个错误是因为 `pd.read_csv()` 函数默认使用 UTF-8 编码读取文件，但是你的文件编码却是 shift-jis，所以需要指定文件编码为 shift-jis。可以这样修改代码： ```python df = pd.read_csv('data.csv', encoding='shift-jisx0213') ``` 如果还是报错，可能是文件本身损坏或者存在其他编码问题，可以尝试使用其他编码方式来读取文件，比如 gb2312、gbk 等。

阅读全文

df = pd.read_csv('data.csv', encoding='shift-jis') UnicodeDecodeError: 'shift_jis' codec can't decode byte 0x87 in position 38

相关推荐

字符编码转换 convert unicode to Shift-JIS

df = pd.read_csv('test.csv',encoding='gbk')报错：UnicodeDecodeError: 'gbk' codec can't decode byte 0xb1 in position 5: illegal multibyte sequence

df = pd.read_csv('test.csv')报错：UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd0 in position 0: invalid continuation byte

df = pd.read_csv('结果表4.csv')报错UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb7 in position 0: invalid start byte

df = pd.read_csv(os.path.join(sub_root, file))报错：UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb1 in position 6: invalid start byte

sales = pd.read_csv('四大城市BBA汽车月销量.csv', encoding='gbk')为什么报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 16: illegal multibyte sequence

import pandas as pd data = pd.read_csv('../data/movie_metadata.csv') UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa8 in position 5663: invalid start byte

data = pd.read_csv('D:/IC_Daily.mat')报错UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa2 in position 116: invalid start byte

df = pd.read_csv('回复数据.csv', encoding='gb18030')，程序报错，

pd.read_csv读取.csv文件，使用utf-8，报错：UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc4 in position 0: invalid continuation byte

jupyternotebook使用sheet1 = pd.read_csv('D:\python test\资料\covid19_data.csv',dtype={'State':object}, encoding='gbk')语句时报错UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd0 in position 0: invalid continuation byte

jupyternotebook使用sheet1 = pd.read_csv('D:\python test\资料\covid19_data.csv',dtype={'State':object})语句时报错UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd0 in position 0: invalid continuation byte

pd.read_csv 报错 UnicodeDecodeError: 'utf-8' codec can't decode byte 0x84 in position 6074: invalid start byte

data = pd.read_csv('weather14.csv')如何将编码改成UTF8

pd.read_csv报错UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbd in position 2406: invalid start byte.

最新推荐

MATLAB-四连杆机构的仿真+项目源码+文档说明

SSM Java项目：StudentInfo 数据管理与可视化分析

管理建模和仿真的文件

负载均衡技术深入解析：确保高可用性的网络服务策略

怎么解决头文件重复包含

pyedgar：Python库简化EDGAR数据交互与文档下载

"互动学习：行动中的多样性与论文攻读经历"

网络监控工具使用宝典：实时追踪网络状况的专家级技巧

unity 实现子物体不跟随父物体移动和旋转

Node.js环境下wfdb文件解码与实时数据处理