jupyter notebook 数据合并
时间: 2023-09-01 13:11:17 浏览: 92
可以使用 Pandas 库来进行数据合并。常见的数据合并方式有以下几种:
1. concat():将多个数据集按照行或列的方向进行拼接。可以使用 axis 参数来指定拼接的方向。
2. merge():按照指定的列将两个数据集进行合并。可以使用 how 参数来指定合并的方式,如 inner、outer、left、right。
3. join():也是按照指定的列将两个数据集进行合并,与 merge() 的区别在于 join() 是基于 index 进行合并。
下面是一个示例代码,演示如何使用 Pandas 进行数据合并:
```python
import pandas as pd
# 创建两个数据集
df1 = pd.DataFrame({'key': ['A', 'B', 'C', 'D'], 'value': [1, 2, 3, 4]})
df2 = pd.DataFrame({'key': ['B', 'D', 'E', 'F'], 'value': [5, 6, 7, 8]})
# 使用 concat() 进行行拼接
df_concat = pd.concat([df1, df2], axis=0)
# 使用 concat() 进行列拼接
df_concat2 = pd.concat([df1, df2], axis=1)
# 使用 merge() 进行按列合并
df_merge = pd.merge(df1, df2, on='key', how='inner')
# 使用 join() 进行按列合并
df1.set_index('key', inplace=True)
df2.set_index('key', inplace=True)
df_join = df1.join(df2, how='inner')
print(df_concat)
print(df_concat2)
print(df_merge)
print(df_join)
```