pd.concat连接两个表,合并重复
使用 pd.concat
函数可以将两个表按照行或列进行合并。如果两个表存在重复的行或列,可以使用参数来进行去重。下面是一个例子:
假设有两个表 df1
和 df2
:
import pandas as pd
df1 = pd.DataFrame({'A': [1, 2, 3],
'B': [4, 5, 6],
'C': [7, 8, 9]})
df2 = pd.DataFrame({'A': [1, 2, 4],
'B': [4, 5, 7],
'C': [7, 8, 10]})
现在我们想要将这两个表按照列进行合并,同时去除重复的行。可以使用如下的代码:
result = pd.concat([df1, df2], axis=1, join='inner')
result = result.loc[:,~result.columns.duplicated()]
这里使用了 pd.concat
函数来将两个表按照列进行合并,并且使用了 join='inner'
参数来去除重复的行。此外,由于 pd.concat
函数默认会保留重复的列名,因此我们使用了 loc[:,~result.columns.duplicated()]
来去除重复的列。
pd.concat合并两个表
可以使用 pd.concat() 函数来合并两个表。该函数的语法如下:
pd.concat([df1, df2], axis=0)
其中,df1 和 df2 是要合并的两个表,axis=0 表示按行合并,如果要按列合并,则将 axis 设为 1。
利用pd.concat合并两个sheet,再利用pd.Series和pd.concat在表格最后一行添加数据
可以使用pd.read_excel
读取Excel文件中的两个sheet,并使用pd.concat
方法将它们合并为一个表格。然后,使用pd.Series
创建一个新的Series对象,再次使用pd.concat
方法将其与合并后的表格连接起来,从而实现在表格的最后一行添加数据的功能。具体代码如下:
import pandas as pd
# 读取Excel文件中的两个sheet
df1 = pd.read_excel('filename.xlsx', sheet_name='Sheet1')
df2 = pd.read_excel('filename.xlsx', sheet_name='Sheet2')
# 将两个表格合并为一个
df = pd.concat([df1, df2], ignore_index=True)
# 创建要添加的数据
new_data = pd.Series({'A': 4, 'B': 7})
# 将新数据转换为DataFrame对象并与合并后的表格连接
df = pd.concat([df, pd.DataFrame(new_data).T], ignore_index=True)
print(df)
其中,pd.read_excel
方法用于读取Excel文件中的数据,sheet_name
参数指定要读取的sheet名称。pd.concat
方法用于将两个表格合并为一个,ignore_index=True
表示忽略原始表格的索引,使用自动生成的新索引。pd.DataFrame(new_data).T
将新数据转换为一个只有一行的DataFrame对象,并使用pd.concat
方法将其与合并后的表格连接起来。
相关推荐
















