写一个python脚本,具体要求如下: 1、已有两个csv表格,第一行为标题行,第一列为文件 2、遍历表格1中的每一行,在表格2中找到具有相同文件名的所在行,对比两行表格中同一标题下的表格内容,统计内容完全一致的个数,将文件名和数字输出到新表格中
时间: 2024-10-12 07:09:23 浏览: 19
你可以使用Python的pandas库来处理这个任务,以下是一个简单的示例脚本:
```python
import pandas as pd
# 读取两个CSV文件
df1 = pd.read_csv('table1.csv', header=0) # 假设表头位于第一行
df2 = pd.read_csv('table2.csv', header=0)
# 创建一个空数据框来存储结果
result_df = pd.DataFrame(columns=['File Name', 'Matches'])
# 遍历df1中的每一行
for index, row in df1.iterrows():
file_name = row['File'] # 获取当前行的文件名
match_rows = df2[df2['File'] == file_name] # 在df2中查找匹配的行
if not match_rows.empty: # 如果有匹配行
matches_count = (match_rows.iloc[:, 1:] == row[1:])all().sum() # 比较除文件名外的所有列是否全等
result_df.loc[index] = [file_name, matches_count]
# 输出结果到新的CSV文件
result_df.to_csv('output.csv', index=False)
```
在这个脚本中,我们首先导入pandas并读取两个CSV文件,然后创建一个新的DataFrame用于存储结果。接着,我们遍历`df1`的每一行,找出`df2`中文件名相同的行,并计算它们除了文件名以外的内容是否完全匹配。最后,我们将结果保存到名为`output.csv`的新文件中。
阅读全文