pd.concat用法
时间: 2023-12-12 15:03:42 浏览: 265
`pd.concat()` 是 pandas 库中的一个函数,用于将一系列 pandas 对象(如 DataFrame 或 Series)沿着一个轴(如行或列)进行拼接。它的常见用法有以下几种:
1. 拼接两个 DataFrame 或 Series(默认在行方向上进行拼接):
```python
import pandas as pd
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df2 = pd.DataFrame({'A': [4, 5, 6], 'B': [7, 8, 9]})
# 在行方向上拼接两个 DataFrame
result = pd.concat([df1, df2])
print(result)
```
输出:
```
A B
0 1 4
1 2 5
2 3 6
0 4 7
1 5 8
2 6 9
```
注意到两个 DataFrame 的索引被保留了下来,如果需要重新生成新索引,可以加上 `ignore_index=True` 参数。
2. 拼接两个 DataFrame 或 Series 在列方向上进行拼接:
```python
import pandas as pd
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df2 = pd.DataFrame({'C': [4, 5, 6], 'D': [7, 8, 9]})
# 在列方向上拼接两个 DataFrame
result = pd.concat([df1, df2], axis=1)
print(result)
```
输出:
```
A B C D
0 1 4 4 7
1 2 5 5 8
2 3 6 6 9
```
3. 拼接两个 DataFrame 或 Series(指定拼接方式为内连接):
```python
import pandas as pd
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df2 = pd.DataFrame({'A': [4, 5, 6], 'B': [7, 8, 9]})
# 内连接两个 DataFrame
result = pd.concat([df1, df2], join='inner')
print(result)
```
输出:
```
A B
0 1 4
1 2 5
2 3 6
0 4 7
1 5 8
2 6 9
```
以上是 `pd.concat()` 的几个常见用法,具体参数还有很多,可以通过查看 pandas 官方文档来获取更多信息。
阅读全文