python语言 多个文件生成的未知个数的df,将多个df中相同tag名的count数字相加
时间: 2023-06-12 18:05:38 浏览: 84
可以通过以下步骤来实现:
1. 创建一个空的字典,用于存储每个tag名对应的count数字总和。
2. 遍历每个文件,读取其中的数据框,并对其中的每个tag名进行处理。可以使用 Pandas 库中的 read_csv() 函数读取 csv 文件,或使用其他适合数据格式的读取函数。
3. 对于每个读取的数据框,遍历其中的每个tag名,并将其count数字加入到字典中对应的tag名的值中,如果字典中不存在该tag名,则将其添加到字典中,并将其count数字作为初始值。
4. 最终得到的字典中,每个tag名对应的值就是所有文件中该tag名的count数字总和。
下面是一份示例代码,假设数据框中包含两列:tag 和 count。
```python
import os
import pandas as pd
# 1. 创建一个空的字典
tag_counts = {}
# 2. 遍历每个文件
for file in os.listdir('path/to/files'):
# 读取数据框
df = pd.read_csv(os.path.join('path/to/files', file))
# 3. 遍历每个tag名并将count数字相加
for index, row in df.iterrows():
tag = row['tag']
count = row['count']
if tag in tag_counts:
tag_counts[tag] += count
else:
tag_counts[tag] = count
# 打印结果
print(tag_counts)
```
这个代码可以实现对指定文件夹中所有文件的读取和处理,并将每个tag名的count数字相加,最后输出一个字典。你可以根据自己的需求对输出结果进行进一步的处理。
阅读全文