pandas中举例说明concat()函数的主要参数及其用法
时间: 2023-09-01 17:13:30 浏览: 128
`pandas.concat()`函数是用于将两个或多个pandas对象(例如DataFrame和Series)沿着指定轴连接在一起的函数。它的主要参数如下:
- `objs`:一个列表,其中包含要连接的pandas对象(DataFrame和Series)。
- `axis`:指定连接的轴。默认情况下,`axis=0`表示按行连接,`axis=1`表示按列连接。
- `keys`:用于创建多层次索引的对象列表。如果指定,则结果将具有多层次列名,并且每个原始对象的列名将成为第二级索引的一部分。
- `join`:指定连接方式。默认值为`join='outer'`,表示使用外连接(union),还可以选择使用内连接(intersection)或左连接(left)等。
- `ignore_index`:指定是否忽略原始对象的索引。默认情况下,`ignore_index=False`表示保留原始索引。
- `sort`:指定是否按照列名对结果进行排序。默认情况下,`sort=False`表示不进行排序。
下面是一个示例,说明如何使用`concat()`函数将两个DataFrame按列连接在一起:
```python
import pandas as pd
# 创建两个DataFrame
df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],
'B': ['B0', 'B1', 'B2', 'B3'],
'C': ['C0', 'C1', 'C2', 'C3'],
'D': ['D0', 'D1', 'D2', 'D3']})
df2 = pd.DataFrame({'E': ['E4', 'E5', 'E6', 'E7'],
'F': ['F4', 'F5', 'F6', 'F7'],
'G': ['G4', 'G5', 'G6', 'G7'],
'H': ['H4', 'H5', 'H6', 'H7']})
# 按列连接两个DataFrame
result = pd.concat([df1, df2], axis=1)
print(result)
```
输出:
```
A B C D E F G H
0 A0 B0 C0 D0 E4 F4 G4 H4
1 A1 B1 C1 D1 E5 F5 G5 H5
2 A2 B2 C2 D2 E6 F6 G6 H6
3 A3 B3 C3 D3 E7 F7 G7 H7
```
阅读全文