首页pandas.concat 用法

pandas.concat 用法

时间: 2024-10-25 11:00:30 浏览: 24

`pandas.concat` 函数是 Pandas 库中用于合并数据的一个关键方法。它可以将多个 DataFrame 或者 Series 合并成一个新的更大的结构，支持水平（row-wise）和垂直（column-wise）的拼接。该函数的基本语法如下： ```python pd.concat(objs, axis=0, ignore_index=False, join='outer', keys=None, levels=None, names=None, verify_integrity=False, sort=False, copy=True) ``` - `objs`: 这可以是一个列表、字典或者其他能生成Series或DataFrame的对象，包含要合并的数据源。 - `axis` (默认0): 决定合并的方向，0 表示沿着索引（行）方向，1 表示沿着列（column）方向。 - `ignore_index`: 如果设置为 True，新的索引将会是从0开始的整数序列，不会保留原有的索引。 - `join`: 可选项，决定连接的方式，包括 'inner', 'outer', 'left', 'right' 等，默认是 'outer'，表示结果会包含所有输入对象的所有非缺失值。 - `keys`, `levels`, `names`: 主要是针对 MultiIndex（多重索引）的参数，用于指定层级和标签。 - `verify_integrity` 和 `sort`: 分别检查合并后的数据是否完整和是否排序，两个参数都为 False 通常提高性能。下面是一些使用示例： ```python # 水平拼接 merged_df = pd.concat([df1, df2], axis=1) # 垂直拼接 merged_df = pd.concat([df1, df2], axis=0) # 如果df1和df2长度相等，则保持原顺序；如果不等，较小长度会被填充NaN # 使用ignore_index=True创建无序索引 new_df = pd.concat([df1, df2], ignore_index=True) ```

阅读全文