你好,现在有50个300M的Excel,文件名为xlsx,要求在10分钟内转换成csv格式,使用软件为jupyter notebook,请问除了pandas,和spark库还能怎么用python快速解决这个问题?
时间: 2023-10-07 20:10:21 浏览: 142
xls2csv:xls转csv
除了Pandas和Spark库,您可以使用`openpyxl`库来读取Excel文件并将其转换为CSV格式。以下是一个示例代码:
```python
import openpyxl
import csv
import os
from datetime import datetime
# 文件夹路径
folder_path = 'path/to/folder/'
# 循环处理Excel文件
for filename in os.listdir(folder_path):
if filename.endswith('.xlsx'):
# 获取Excel文件的路径
file_path = folder_path + filename
# 读取Excel文件
workbook = openpyxl.load_workbook(file_path)
sheet = workbook.active
# CSV文件的路径
csv_file_path = folder_path + filename[:-5] + '.csv'
# 打开CSV文件并写入数据
with open(csv_file_path, 'w', newline='', encoding='utf-8') as csv_file:
writer = csv.writer(csv_file)
for row in sheet.iter_rows():
# 将每行数据转换为列表
row_data = [cell.value for cell in row]
writer.writerow(row_data)
# 输出转换完成的时间
print('Conversion completed at', datetime.now().strftime('%Y-%m-%d %H:%M:%S'))
```
此代码使用`openpyxl`库读取Excel文件并将其转换为CSV格式,并使用`csv`库将数据写入CSV文件。通过遍历文件夹中的所有Excel文件,可以快速地完成转换过程。
阅读全文