python语言将多个文件生成的未知个数的df df = pd.DataFrame(sorted_tags, columns=['tag', 'count'])中的相同tag的count数字相加
时间: 2023-06-13 15:05:02 浏览: 137
python 处理多行多列多文件的数据
可以使用 Pandas 库的 groupby 和 sum 函数来实现相同 tag 的 count 数字相加。
假设你有多个文件生成的 DataFrame,存储在一个列表 `dfs` 中,可以使用以下代码:
```python
import pandas as pd
# 合并所有 DataFrame
df = pd.concat(dfs)
# 按 tag 分组并求和
df = df.groupby('tag')['count'].sum().reset_index()
```
其中,`groupby('tag')` 表示按照 tag 列进行分组,`['count'].sum()` 表示对每组的 count 列进行求和,`reset_index()` 表示将分组后的结果转换为新的 DataFrame。
最终的结果将会是一个新的 DataFrame,其中每行表示一个 tag 和相应的 count 数字总和。
阅读全文