pd.concat() 函数的用法 以及他的索引是怎么设定的
时间: 2024-04-15 10:27:28 浏览: 74
pd.concat() 是 pandas 库中用于合并数据的函数,可以按照指定的轴(行或列)将多个数据对象进行连接。以下是 pd.concat() 函数的用法和索引设置的方法:
1. 用法示例:
```python
import pandas as pd
# 创建两个数据集
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df2 = pd.DataFrame({'A': [7, 8, 9], 'B': [10, 11, 12]})
# 沿着行的方向进行连接
result = pd.concat([df1, df2])
print(result)
```
输出结果:
```
A B
0 1 4
1 2 5
2 3 6
0 7 10
1 8 11
2 9 12
```
2. 索引设置:
默认情况下,pd.concat() 函数会保留原始数据的索引。如果需要重新设置索引,可以使用 ignore_index 参数。
```python
result = pd.concat([df1, df2], ignore_index=True)
print(result)
```
输出结果:
```
A B
0 1 4
1 2 5
2 3 6
3 7 10
4 8 11
5 9 12
```
通过设置 `ignore_index=True`,重新设置了连接后的数据集的索引。
另外,还可以使用 keys 参数来为连接后的数据集添加层次化索引。这在合并多个数据集时特别有用,可以通过层次化索引来标识来源数据。
```python
result = pd.concat([df1, df2], keys=['df1', 'df2'])
print(result)
```
输出结果:
```
A B
df1 0 1 4
1 2 5
2 3 6
df2 0 7 10
1 8 11
2 9 12
```
在连接后的数据集上,通过层次化索引可以区分每个数据集的来源。
阅读全文