读取一个30g以上的csv文件，逐行读取该csv文件，文件有五列，分别为schedulerid、nameid、addlongtime、variableid、val。当读取到行，第二列为47且第三列时间相同时，时间格式举例为20220223082350，构建新的csv文件，文件一共有三列，第一列为schedule，第二列为time，第三列为weiyi，将连续相同的第三列情况下的第五列数值，写入在新建csv文件weiyi下的一个单元格中每个数值以“,”隔开，并将第三列相同的时间改变格式为2022/02/23 08:23:50写入新建csv文件time中，第一列写入新建文件csv文件schedule中。

时间: 2023-05-30 12:07:09 浏览: 45

由于数据量很大，可以采用分块读取的方式，每次读取一定行数的数据，处理后写入新的csv文件中。示例代码： ```python import pandas as pd import datetime # 定义读取的块大小 chunksize = 100000 # 定义输出文件名和列名 output_file = 'output.csv' output_cols = ['schedule', 'time', 'weiyi'] # 打开输出文件，写入列名 with open(output_file, 'w', newline='') as f: writer = csv.writer(f) writer.writerow(output_cols) # 逐块读取原始文件 for df in pd.read_csv('input.csv', chunksize=chunksize): # 筛选出第二列为47的行 df = df[df['nameid'] == 47] # 按时间排序 df = df.sort_values('addlongtime') # 遍历每一行，构建新的数据行 new_rows = [] last_time = None last_weiyi = None for index, row in df.iterrows(): time_str = row['addlongtime'] # 时间字符串，格式为20220223082350 time_obj = datetime.datetime.strptime(time_str, '%Y%m%d%H%M%S') # 转换为datetime对象 weiyi = row['val'] if time_obj == last_time: # 如果时间相同，将当前weiyi加入到上一个数据行的weiyi中 last_weiyi.append(weiyi) else: # 如果时间不同，构建新的数据行 schedule = row['schedulerid'] time_str = time_obj.strftime('%Y/%m/%d %H:%M:%S') # 将时间格式化为2022/02/23 08:23:50 last_time = time_obj last_weiyi = [weiyi] new_row = [schedule, time_str, last_weiyi] new_rows.append(new_row) # 写入新的数据行到输出文件中 with open(output_file, 'a', newline='') as f: writer = csv.writer(f) for row in new_rows: writer.writerow(row) ``` 注意：由于数据量很大，上述代码可能需要较长时间才能运行完毕。建议在测试时先读取一小部分数据进行测试。

相关推荐

php读取csv文件后,uft8 bom导致在页面上显示出现问题的解决方法

Python基于csv模块实现读取与写入csv数据的方法

elasticsearch_loader：用于将数据文件（json，parquet，csv，tsv）批量加载到ElasticSearch的工具

数据合并技巧：利用Pandas读取多个CSV文件

使用 CSV 文件和随机变量生成测试数据

Selenium数据驱动测试：Excel与CSV文件

使用Spring Batch处理文件：读取和写入各种文件格式

使用CSV数据文件进行测试数据管理

python实现读取csv文件指定列，并保存到一个新文件中

html使用d3读取csv文件的一列并将其写入一个p标签内

用python读取sqlite数据库文件找到id相同的导出为csv文件

用phthon写一个读取文件夹内CSV文件数据到数据库的代码

如果有一个包含vehicle_id,time,lon,lat四列数据的csv文件，按照vehicle_id

可以帮我写一个完整的echart读取csv文件中数据生成柱状图的代码吗

写一个spark代码对csv文件进行读取，并将结果生产到kafka中

帮我写个vue读取csv文件代码

按照id、name、sex一致的字段合并5个csv文件

按照id、name、sex一致的字段合并两个csv文件

spark读取csv文件

最新推荐

RTL8188FU-Linux-v5.7.4.2-36687.20200602.tar(20765).gz

管理建模和仿真的文件

实现实时数据湖架构：Kafka与Hive集成

系统函数是1+5*z^(-1)+5*z^(-2)+z^(-3) ，给出Matlab中求该系统频率响应的代码

c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf

"互动学习：行动中的多样性与论文攻读经历"

实现实时监控告警系统：Kafka与Grafana整合

c语言中用leapyear函数输出2000年到2200年之间所有的闰年

建筑供配电系统相关课件.pptx

关系数据表示学习

系统函数是1+5z^(-1)+5z^(-2)+z^(-3) ，给出Matlab中求该系统频率响应的代码