pd.contact的使用
时间: 2024-04-22 15:26:10 浏览: 12
`pd.contact` 是 pandas 库中用于合并 DataFrame 的函数之一。具体用法如下:
```python
pd.concat(objs, axis=0, join='outer', ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, sort=False, copy=True)
```
其中,参数含义如下:
- `objs`:list/tuple,表示需要合并的 DataFrame 序列。
- `axis`:int,表示沿着哪个轴进行合并,0 表示纵向合并,1 表示横向合并。
- `join`:str,表示合并时使用的方式,包括'outer'、'inner'、'left'、'right'四种方式,默认使用'outer'方式。
- `ignore_index`:bool,表示是否忽略原 DataFrame 的索引,如果为 True,则新 DataFrame 的行索引将重新生成,否则将保留原索引。
- `keys`:list,表示创建多级索引的键值。
- `levels`:list,表示创建多级索引的级别。
- `names`:list,表示创建多级索引的名称。
- `verify_integrity`:bool,表示是否检查合并后的 DataFrame 是否有重复索引。
- `sort`:bool,表示是否对结果进行排序。
- `copy`:bool,表示是否复制数据。
示例代码如下:
```python
import pandas as pd
# 创建两个 DataFrame
df1 = pd.DataFrame({'key': ['A', 'B', 'C'], 'value1': [1, 2, 3]})
df2 = pd.DataFrame({'key': ['D', 'E', 'F'], 'value2': [4, 5, 6]})
# 纵向合并
df_concat = pd.concat([df1, df2])
print(df_concat)
# 横向合并
df_concat = pd.concat([df1, df2], axis=1)
print(df_concat)
# 忽略原索引
df_concat = pd.concat([df1, df2], ignore_index=True)
print(df_concat)
# 创建多级索引
df_concat = pd.concat([df1, df2], keys=['df1', 'df2'])
print(df_concat)
```
输出结果如下:
```
key value1 value2
0 A 1.0 NaN
1 B 2.0 NaN
2 C 3.0 NaN
0 D NaN 4.0
1 E NaN 5.0
2 F NaN 6.0
key value1 key value2
0 A 1 D 4
1 B 2 E 5
2 C 3 F 6
key value1 value2
0 A 1.0 NaN
1 B 2.0 NaN
2 C 3.0 NaN
3 D NaN 4.0
4 E NaN 5.0
5 F NaN 6.0
key value1 value2
df1 0 A 1.0 NaN
1 B 2.0 NaN
2 C 3.0 NaN
df2 0 D NaN 4.0
1 E NaN 5.0
2 F NaN 6.0
```