将openpyxl读取一个EXCEL文件获取的sheet内容转为dataframe再使用pandas另存为新的文件发现新文件大小比原文件小

这种情况可能是由于以下原因导致的： 1. 文件格式不同：原文件可能是.xlsx格式，而新文件可能是.csv格式，后者的文件大小通常比前者小。 2. 数据类型不同：在将数据从Excel文件转换为DataFrame时，可能会出现数据类型转换的情况。例如，原文件中的某些列是数字类型，但是在转换为DataFrame时被转换为了字符串类型。这可能会导致新文件大小的变化。 3. 空值处理：在将数据从Excel文件转换为DataFrame时，可能会对空值进行处理。例如，将空值替换为0或其他值。这可能会导致新文件大小的变化。为了确定原因，可以尝试将新文件转换为与原文件相同的格式，并检查数据类型和空值处理。如果这些都相同，那么文件大小的变化可能是由于数据量减少或其他原因导致的。

使用openpyxl读取一个EXCEL文件获取的sheet内容转为dataframe再使用pandas另存为新的文件发现新文件的单元格包含原文件没有的_x000D_

这个问题通常是由于源文件中包含回车符（Carriage Return）或换行符（Line Feed）引起的，这些符号在不同操作系统和软件中的显示方式可能会有所不同。你可以尝试使用 `strip()` 函数去除这些符号，然后再另存为新的文件。具体步骤如下： ```python import openpyxl import pandas as pd # 打开源文件 workbook = openpyxl.load_workbook('source.xlsx') # 读取指定的 sheet worksheet = workbook['Sheet1'] # 将 sheet 转为 dataframe data = worksheet.values columns = next(data)[1:] df = pd.DataFrame(data, columns=columns) # 去除回车符和换行符 df = df.replace('\r\n', '', regex=True) # 另存为新文件 df.to_excel('new_file.xlsx', index=False) ``` 这样处理后，新文件中的单元格就不会包含 `_x000D_` 了。

给我一段代码，功能如下：获取了一个excel文件路径并读取为dataframe文件，将dataframe文件改变内容后不用另存，直接覆盖原来的excel文件

在Python中，我们可以使用pandas库处理Excel文件，并结合`openpyxl`或`xlsxwriter`库来直接在原文件上修改数据，而无需另存。这里是一个示例，假设你已经安装了`pandas`, `openpyxl`或`xlsxwriter`： ```python import pandas as pd # 假设你已经有了一个excel文件路径 file_path = "example.xlsx" # 使用pandas读取Excel文件 df = pd.read_excel(file_path) # 进行一些数据操作，例如添加、删除或更新一行或一列 # df.loc[0, 'new_column'] = 'new_value' # 添加新列 # df.drop(index=0, inplace=True) # 删除某行 # df['column_name'][index] = new_value # 更新值 # 现在我们使用openpyxl对原文件进行写入，注意这里使用的是追加模式('a')，而不是覆盖模式('w') # 如果你想覆盖原有文件，可以去掉'a'，但是要注意这是会丢失原始数据的行为 with pd.ExcelWriter(file_path, engine='openpyxl', mode='a') as writer: df.to_excel(writer, sheet_name='Sheet1', index=False) # 或者如果你喜欢使用xlsxwriter，下面的代码类似，不过需要先创建workbook # from xlsxwriter.workbook import Workbook # workbook = Workbook(file_path) # worksheet = workbook.active # df.to_excel(worksheet, index=False) # workbook.close() # 提醒：在实际操作中，记得备份原始文件以防意外！

阅读全文

将openpyxl读取一个EXCEL文件获取的sheet内容转为dataframe再使用pandas另存为新的文件发现新文件大小比原文件小

使用openpyxl读取一个EXCEL文件获取的sheet内容转为dataframe再使用pandas另存为新的文件发现新文件的单元格包含原文件没有的_x000D_

给我一段代码，功能如下：获取了一个excel文件路径并读取为dataframe文件，将dataframe文件改变内容后不用另存，直接覆盖原来的excel文件

相关推荐

高效Excel文件合并与读写的解决方案

Python脚本教程：轻松合并Excel文件

Python处理CSV/Excel文件：读写操作详解

在使用openpyxl读取excel数据后如何转化为dataframe

pandas读取excel sheet 作为dataframe

python读取excel文件转为dataframe

pandas读取excel文件sheet

Python Pandas批量读取excel文件到dataframe的方法

在Python中如何将字典数据转换为DataFrame，并将其保存为CSV文件？如何读取Excel文件中的数据到DataFrame？

pandas读取excel文件怎么指定sheet

pandas读取Excel，按照格式读取dataframe

使用pandas读取excel文件

Pandas 读取excel返回dataframe格式

如何将Excel文件中的数据以字符串的形式读取并转换为Pandas DataFrame？

大家在看

SM621G1 BA 手册

SCSI-ATA-Translation-3_(SAT-3)-Rev-01a

小华HC32L19X SPI 驱片外FLASH 例程

景象匹配精确制导中匹配概率的一种估计方法

STK Scheduler使用向导

最新推荐

使用matlab或python将txt文件转为excel表格

python 实现读取一个excel多个sheet表并合并的方法

Pandas读取并修改excel的示例代码

医疗影像革命-YOLOv11实现病灶实时定位与三维重建技术解析.pdf

Spring Websocket快速实现与SSMTest实战应用

电力电子技术的智能化：数据中心的智能电源管理

通过spark sql读取关系型数据库mysql中的数据

新版微软inspect工具下载：32位与64位版本

如何运用电力电子技术实现IT设备的能耗监控

2635.656845多位小数数字，js不使用四舍五入保留两位小数，然后把结果千分位，想要的结果是2,635.65;如何处理