将csv文件平均分成5份,并将不能被平均分的部分放入另一个文件中去
时间: 2024-05-16 19:12:01 浏览: 61
把csv按日期分隔成不同文件
可以使用Python中的pandas库来处理CSV文件。首先需要读取CSV文件,然后获取文件的行数,并计算出每个文件应该包含的行数。然后使用pandas库的head函数和tail函数来选择需要分割的行,再使用to_csv函数将每个部分保存为一个新的CSV文件。对于不能被平均分的部分,可以使用pandas库的iloc函数来选择需要保存的行,再次使用to_csv函数将其保存为另一个CSV文件。以下是Python代码示例:
```
import pandas as pd
import math
# 读取CSV文件
df = pd.read_csv('input.csv')
# 获取文件总行数
total_rows = df.shape[0]
# 计算每个文件应包含的行数
rows_per_file = math.ceil(total_rows / 5)
# 分割CSV文件
for i in range(5):
start_row = i * rows_per_file
end_row = (i + 1) * rows_per_file
if end_row > total_rows:
end_row = total_rows
filename = f'part{i+1}.csv'
df.iloc[start_row:end_row].to_csv(filename, index=False)
# 处理不能被平均分的部分
if end_row < total_rows:
filename = 'remainder.csv'
df.iloc[end_row:].to_csv(filename, index=False)
```
注意,以上代码是一个简单的示例,需要根据实际情况进行修改,例如文件路径、文件名等。
阅读全文