python将CSV文件(excel文件)按固定行数拆分成小文件
时间: 2024-05-15 08:17:49 浏览: 25
可以使用Python的pandas库进行CSV文件的读取和处理。下面是将CSV文件按照固定行数拆分成多个小文件的代码示例:
```python
import pandas as pd
# 读入CSV文件,header为列名所在行的索引
df = pd.read_csv('filename.csv', header=0)
# 将CSV文件拆分成多个小文件,每个文件包含10行数据
batch_size = 10
for i, chunk in enumerate(pd.read_csv('filename.csv', chunksize=batch_size)):
chunk.to_csv(f'filename_{i}.csv', index=False)
```
代码中,先使用pandas库读取CSV文件,然后利用`chunksize`参数将CSV文件按固定大小拆分成多个小文件,最后将拆分出的每个小文件保存为一个新的CSV文件,文件名中包含序号以便区分不同的文件。
相关问题
python按固定列拆分csv文件
如果你需要按照固定的列数进行拆分 CSV 文件,你可以使用 Python 自带的 csv 模块来读取和处理 CSV 文件,然后将每个拆分后的子文件中的行数写入指定的文件中。下面是一个示例代码:
```python
import csv
# 读取 CSV 文件
with open('input.csv', newline='') as csvfile:
reader = csv.reader(csvfile)
# 获取 CSV 表头
headers = next(reader)
# 设置拆分的列数
split_columns = 3
# 设置每个拆分后的子文件中的行数
split_size = 1000
# 创建拆分后的 CSV 文件
split_files = [open(f'output_{i}.csv', 'w', newline='') for i in range(split_columns)]
writers = [csv.writer(file) for file in split_files]
# 写入 CSV 表头
for writer in writers:
writer.writerow(headers)
# 拆分 CSV 文件
count = 0
for row in reader:
for i in range(split_columns):
writers[i].writerow([row[j] for j in range(i, len(row), split_columns)])
count += 1
# 每写入 split_size 行就将行数写入指定的文件中
if count % split_size == 0:
with open('rows_count.txt', 'a') as f:
f.write(f'{count}\n')
# 关闭拆分后的 CSV 文件
for file in split_files:
file.close()
```
上述代码将 `input.csv` 文件按照每 3 列进行拆分,并将拆分后的子文件命名为 `output_0.csv`、`output_1.csv` 和 `output_2.csv`。每个拆分后的子文件中最多包含 1000 行,当写入的行数达到 1000 行时,将行数写入 `rows_count.txt` 文件中。你可以根据自己的需求修改拆分的列数、拆分后的文件名和每个拆分后的子文件中的行数。
python将csv文件保存为excel
要将 CSV 文件保存为 Excel 文件,可以使用 `pandas` 库来读写文件。`pandas` 库中的 `read_csv()` 方法可以读取 CSV 文件,`to_excel()` 方法可以将数据保存为 Excel 文件。按照以下步骤操作:
1. 导入相关模块。导入 `pandas` 库。
```python
import pandas as pd
```
2. 读取 CSV 文件。使用 `read_csv()` 方法读取 CSV 文件,得到一个 `DataFrame` 对象。
```python
df = pd.read_csv('data.csv')
```
3. 将数据保存为 Excel 文件。使用 `to_excel()` 方法将 `DataFrame` 对象保存为 Excel 文件。
```python
file_path = 'data.xlsx'
df.to_excel(file_path, index=False)
```
完整代码如下:
```python
import pandas as pd
# 读取 CSV 文件
df = pd.read_csv('data.csv')
# 将数据保存为 Excel 文件
file_path = 'data.xlsx'
df.to_excel(file_path, index=False)
```
这样就可以将 CSV 文件保存为 Excel 文件了。注意,`to_excel()` 方法中的 `index=False` 参数表示不将行索引保存到 Excel 文件中。如果需要保存行索引,则可以省略该参数。