python语言将多个文件生成的多个df df = pd.DataFrame(sorted_tags, columns=['tag', 'count'])中的相同tag的count数字相加
时间: 2023-06-13 14:05:38 浏览: 70
可以使用 pandas 库中的 groupby 和 sum 方法来实现。
假设你有多个 DataFrame,每个 DataFrame 中都有一个名为 sorted_tags 的列,你可以像下面这样将它们合并成一个 DataFrame:
```
import pandas as pd
# 假设你有多个 DataFrame,每个 DataFrame 中都有一个名为 sorted_tags 的列
df1 = pd.DataFrame({'tag': ['A', 'B', 'C'], 'count': [1, 2, 3]})
df2 = pd.DataFrame({'tag': ['B', 'C', 'D'], 'count': [4, 5, 6]})
df3 = pd.DataFrame({'tag': ['C', 'D', 'E'], 'count': [7, 8, 9]})
# 将多个 DataFrame 合并成一个 DataFrame
df = pd.concat([df1, df2, df3], ignore_index=True)
# 将相同的 tag 的 count 数字相加
df = df.groupby(['tag']).sum().reset_index()
print(df)
```
输出结果为:
```
tag count
0 A 1
1 B 6
2 C 15
3 D 14
4 E 9
```
可以看到,相同的 tag 的 count 数字已经被相加了。
相关问题
python语言将多个文件生成的未知个数的df df = pd.DataFrame(sorted_tags, columns=['tag', 'count'])中的相同tag的count数字相加
可以使用 Pandas 库的 groupby 和 sum 函数来实现相同 tag 的 count 数字相加。
假设你有多个文件生成的 DataFrame,存储在一个列表 `dfs` 中,可以使用以下代码:
```python
import pandas as pd
# 合并所有 DataFrame
df = pd.concat(dfs)
# 按 tag 分组并求和
df = df.groupby('tag')['count'].sum().reset_index()
```
其中,`groupby('tag')` 表示按照 tag 列进行分组,`['count'].sum()` 表示对每组的 count 列进行求和,`reset_index()` 表示将分组后的结果转换为新的 DataFrame。
最终的结果将会是一个新的 DataFrame,其中每行表示一个 tag 和相应的 count 数字总和。
python语言将多个文件生成的未知个数的df df = pd.DataFrame(sorted_tags, columns=['tag', 'count'])中相同tag名的count数字相加
可以使用 pandas 库中的 groupby 和 sum 方法,对相同 tag 的 count 进行求和。
示例代码:
```
import pandas as pd
# 假设有三个 DataFrame,分别为 df1、df2、df3
dfs = [df1, df2, df3]
# 将 dfs 中的 DataFrame 合并为一个 DataFrame
merged_df = pd.concat(dfs, ignore_index=True)
# 对 tag 进行分组,并对 count 求和
grouped_df = merged_df.groupby('tag')['count'].sum()
# 将结果转换为 DataFrame
result_df = pd.DataFrame({'tag': grouped_df.index, 'count': grouped_df.values})
```
其中,merged_df 是将多个 DataFrame 合并后的 DataFrame,grouped_df 是对 tag 进行分组并求和后的 Series,result_df 是将结果转换为 DataFrame 后的最终结果。
阅读全文