for csv_file in csv_files: with open(os.path.join(source_folder, csv_file), 'r') as f: reader = csv.reader(f) # 遍历每行数据 for i, row in enumerate(reader): # 将第i行写入对应的新csv文件 with open(os.path.join(output_folder, f"output{i}.csv"), 'a') as out_file: # 将第i行写入对应的新csv文件 writer = csv.writer(out_file) writer.writerow(row)运行这段代码输出的csv文件每个都多出隔行空行,怎么删去
时间: 2024-02-14 09:04:17 浏览: 72
这段代码中每次打开一个新的输出文件时,使用的是'a'模式,即追加模式。因此,如果执行多次写入操作,每次写入操作之间就会有一个空行。如果要避免这种情况,可以在每次写入前先检查文件是否为空,如果为空才进行写入操作,否则不进行任何操作。
可以将以下代码:
```
with open(os.path.join(output_folder, f"output{i}.csv"), 'a') as out_file:
```
修改为:
```
out_file_path = os.path.join(output_folder, f"output{i}.csv")
if os.path.exists(out_file_path) and os.path.getsize(out_file_path) > 0:
continue
with open(out_file_path, 'a') as out_file:
```
这样就可以在每次写入前检查文件是否为空,如果为空才进行写入操作,否则跳过该操作,从而避免多个文件之间出现隔行空行的情况。
相关问题
import csv import os import pandas as pd # 源文件夹路径 source_folder = "E:/lexin/output" # 新csv文件夹路径 output_folder = "E:/lexin/output2" # 获取源文件夹中的所有csv文件 csv_files = [f for f in os.listdir(source_folder) if f.endswith('.csv')] # 创建新的csv文件 output_files = [] with open(os.path.join(output_folder, "output.csv"), 'w') as output_file: output_files.append(csv.writer(output_file)) for i in range(1, len(csv_files)): output_file_path = os.path.join(output_folder, f"output{i}.csv") with open(output_file_path, 'w') as new_output_file: output_files.append(csv.writer(new_output_file)) # 遍历每个csv文件 for csv_file in csv_files: with open(os.path.join(source_folder, csv_file), 'r') as f: reader = csv.reader(f) # 遍历每行数据 for i, row in enumerate(reader): # 将第i行写入对应的新csv文件 with open(os.path.join(output_folder, f"output{i}.csv"), 'a', newline='') as out_file:#newline=''作用:避免出现空行。 writer = csv.writer(out_file) writer.writerow(row)运行这段代码,要想将输出的csv文件以文件中第5第6列第一行数据为文件名,怎么修改
可以按照如下方式修改代码,以第5列和第6列的数据为文件名:
```
import csv
import os
import pandas as pd
# 源文件夹路径
source_folder = "E:/lexin/output"
# 新csv文件夹路径
output_folder = "E:/lexin/output2"
# 获取源文件夹中的所有csv文件
csv_files = [f for f in os.listdir(source_folder) if f.endswith('.csv')]
# 遍历每个csv文件
for csv_file in csv_files:
with open(os.path.join(source_folder, csv_file), 'r') as f:
reader = csv.reader(f)
# 获取第5列和第6列的数据作为文件名
file_name = f"{reader[0][4]}_{reader[0][5]}.csv"
output_file_path = os.path.join(output_folder, file_name)
# 将第一个csv文件的数据写入新的csv文件
if csv_file == csv_files[0]:
with open(output_file_path, 'w', newline='') as output_file:
writer = csv.writer(output_file)
for row in reader:
writer.writerow(row)
# 将其他csv文件的数据追加到对应的新csv文件中
else:
with open(output_file_path, 'a', newline='') as output_file:
writer = csv.writer(output_file)
for row in reader:
writer.writerow(row)
```
在上述代码中,我们首先遍历每个csv文件,然后获取第5列和第6列的数据作为新csv文件的文件名。接着,我们判断当前csv文件是否为第一个csv文件,是的话就创建一个新的csv文件,并将第一个csv文件的数据写入其中;否则,我们打开对应的新csv文件,并将当前csv文件的数据追加到其中。
注意,在使用 `csv.reader()` 函数时,我们需要先读取第一行数据,即 `reader[0]`,才能获取第5列和第6列的数据。同时,在打开新csv文件时,需要设置 `newline=''`,避免出现空行。
import csv import os source_folder = "E:/lexin/output"# 源文件夹路径 output_folder = "E:/lexin/output2"# 新csv文件夹路径 csv_files = [f for f in os.listdir(source_folder) if f.endswith('.csv')]# 获取源文件夹中的所有csv文件 output_files = []# 创建新的csv文件 with open(os.path.join(output_folder, "output.csv"), 'w') as output_file: output_files.append(csv.writer(output_file)) for i in range(1, len(csv_files)): output_file_path = os.path.join(output_folder, f"output{i}.csv") with open(output_file_path, 'w') as new_output_file: output_files.append(csv.writer(new_output_file)) for csv_file in csv_files:# 遍历每个csv文件 with open(os.path.join(source_folder, csv_file), 'r') as f: reader = csv.reader(f) for i, row in enumerate(reader):# 遍历每行数据 with open(os.path.join(output_folder, f"output{i}.csv"), 'a') as out_file:# 将第i行写入对应的新csv文件 writer = csv.writer(out_file) writer.writerow(row)这串代码输出的csv文件中间隔了一行空行,怎么解决
你可以在写入每一行数据后,再写一行空行,这样就可以避免中间隔了一行空行的问题。具体可以修改以下代码:
```
for i, row in enumerate(reader):# 遍历每行数据
with open(os.path.join(output_folder, f"output{i}.csv"), 'a') as out_file:# 将第i行写入对应的新csv文件
writer = csv.writer(out_file)
writer.writerow(row)
writer.writerow([]) # 写入一行空行
```
这样就可以在每行数据之间添加一行空行了。
阅读全文
相关推荐
![-](https://img-home.csdnimg.cn/images/20241231044833.png)
![-](https://img-home.csdnimg.cn/images/20241231045053.png)
![-](https://img-home.csdnimg.cn/images/20241231045053.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![-](https://img-home.csdnimg.cn/images/20241226111658.png)
![rar](https://img-home.csdnimg.cn/images/20241231044955.png)
![-](https://img-home.csdnimg.cn/images/20241226111658.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
网页内源代码模板如下: <html> <meta http-equiv="Content=-Type" content="text/html; charset=utf-8"> <head> </head> <body>[talkid:138031370]2014年4月20日 03:55:45 , 111222 向 232323 发送 我们已经是好友了,开始聊天吧! () [talkid:138031371]2014年4月20日 04:45:45 , 111222 向 123456 发送 音频 :[<ahref="files/f/f123fsasfsfsjdfrhf_n.m4a"]>音频
() [talkid:138031372]2014年4月20日 04:55:45 , 111222 向 123456 发送 图片 :[<ahref="files/f/f123fsasfsfsjdfrhf_n.jpg"]>图片 () </body> </html> 利用python爬虫,打开C:/Users/test/Desktop/DIDItest文件夹下多个文件夹内的html文件源代码,并爬取源代码中的ID、时间、发送号码、接收号码、信息类型、发送内容,如果发送内容不为文本,则提取文件所在链接地址,并将爬取的内容写入csv中,爬取talkid、时间精确至年月日时分秒、发送号码提取第一个 data-hint"">之间的数字,接收号码提取第二个data-hint"">,信息类型就提取 发送与:之间的文字,如果没有:则定义为文字![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
利用python爬虫,提取C:/Users/test/Desktop/DIDItest文件夹下多个文件内的html文件源代码,并提取源代码中的ID、时间、发送号码、接收号码、发送内容,如果发送内容为音频则提取音频所在位置,反之则保留发送内容,并将爬取的内容写入csv中 网页内源代码如下: <html> <meta http-equiv="Content=-Type" content="text/html; charset=utf-8"> <head> </head> <body>[talkid:138031361]2014年4月20日 03:55:45 , 434343 向 232323 发送 我们已经是好友了,开始聊天吧! () [talkid:138031362]2014年4月20日 04:45:45 , 434343 向 123456 发送 音频 :[<ahref="files/f/f123fsasfsfsjdfrhf_n.m4a"]>音频
() [talkid:138031363]2014年4月20日 04:55:45 , 434343 向 123456 发送 音频 :[<ahref="files/f/f123fsasfsfsjdfrhf_n.jpg"]>图片 () [talkid:138031364]2014年4月20日 05:55:45 , 434343 向 3234221 发送 我们已经是好友了,开始聊天吧! () [talkid:138031365]2014年4月20日 06:55:45 , 434343 向 1359075 发送 我们已经是好友了,开始聊天吧! () </body> </html>![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
网页内源代码模板如下: <html> <meta http-equiv="Content=-Type" content="text/html; charset=utf-8"> <head> </head> <body>[talkid:138031361]2014年4月20日 03:55:45 , 434343 向 232323 发送 我们已经是好友了,开始聊天吧! () [talkid:138031362]2014年4月20日 04:45:45 , 434343 向 123456 发送 音频 :[<ahref="files/f/f123fsasfsfsjdfrhf_n.m4a"]>音频
() [talkid:138031363]2014年4月20日 04:55:45 , 434343 向 123456 发送 音频 :[<ahref="files/f/f123fsasfsfsjdfrhf_n.jpg"]>图片 () [talkid:138031364]2014年4月20日 05:55:45 , 434343 向 3234221 发送 我们已经是好友了,开始聊天吧! () [talkid:138031365]2014年4月20日 06:55:45 , 434343 向 1359075 发送 我们已经是好友了,开始聊天吧! () </body> </html> 利用python爬虫,打开C:/Users/test/Desktop/DIDItest文件夹下多个文件夹内的html文件源代码,并爬取源代码中的ID、时间、发送号码、接收号码、发送内容,如果发送内容为音频则提取音频所在位置,反之则保留发送内容,并将爬取的内容写入csv中![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
利用python爬虫,提取C:/Users/test/Desktop/DIDItest文件夹下多个文件内的html文件源代码,并提取源代码中的ID、时间、发送号码、接收号码、发送内容,如果发送内容为音频则提取音频所在位置,反之则保留发送内容,并将爬取的内容写入csv中 其中一个网页内源代码如下: <html> <meta http-equiv="Content=-Type" content="text/html; charset=utf-8"> <head> </head> <body>[talkid:138031361]2014年4月20日 03:55:45 , 434343 向 232323 发送 我们已经是好友了,开始聊天吧! () [talkid:138031362]2014年4月20日 04:45:45 , 434343 向 123456 发送 音频 :[<ahref="files/f/f123fsasfsfsjdfrhf_n.m4a"]>音频
() [talkid:138031363]2014年4月20日 04:55:45 , 434343 向 123456 发送 音频 :[<ahref="files/f/f123fsasfsfsjdfrhf_n.jpg"]>图片 () [talkid:138031364]2014年4月20日 05:55:45 , 434343 向 3234221 发送 我们已经是好友了,开始聊天吧! () [talkid:138031365]2014年4月20日 06:55:45 , 434343 向 1359075 发送 我们已经是好友了,开始聊天吧! () </body> </html>![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)