pandas.concat 用法
时间: 2024-10-25 11:00:30 浏览: 7
`pandas.concat` 函数是 Pandas 库中用于合并数据的一个关键方法。它可以将多个 DataFrame 或者 Series 合并成一个新的更大的结构,支持水平(row-wise)和垂直(column-wise)的拼接。该函数的基本语法如下:
```python
pd.concat(objs, axis=0, ignore_index=False, join='outer', keys=None, levels=None, names=None, verify_integrity=False, sort=False, copy=True)
```
- `objs`: 这可以是一个列表、字典或者其他能生成Series或DataFrame的对象,包含要合并的数据源。
- `axis` (默认0): 决定合并的方向,0 表示沿着索引(行)方向,1 表示沿着列(column)方向。
- `ignore_index`: 如果设置为 True,新的索引将会是从0开始的整数序列,不会保留原有的索引。
- `join`: 可选项,决定连接的方式,包括 'inner', 'outer', 'left', 'right' 等,默认是 'outer',表示结果会包含所有输入对象的所有非缺失值。
- `keys`, `levels`, `names`: 主要是针对 MultiIndex(多重索引)的参数,用于指定层级和标签。
- `verify_integrity` 和 `sort`: 分别检查合并后的数据是否完整和是否排序,两个参数都为 False 通常提高性能。
下面是一些使用示例:
```python
# 水平拼接
merged_df = pd.concat([df1, df2], axis=1)
# 垂直拼接
merged_df = pd.concat([df1, df2], axis=0) # 如果df1和df2长度相等,则保持原顺序;如果不等,较小长度会被填充NaN
# 使用ignore_index=True创建无序索引
new_df = pd.concat([df1, df2], ignore_index=True)
```
阅读全文