pd.DataFrame按照列拼接
时间: 2023-02-07 16:22:35 浏览: 135
可以使用 `pd.concat()` 函数来实现。例如,假设你有两个数据帧 `df1` 和 `df2`,要按照列将它们拼接起来,你可以这样做:
```
result = pd.concat([df1, df2], axis=1)
```
其中,参数 `axis=1` 表示按照列进行拼接。如果你想在拼接时保留所有的行,你可以使用参数 `join='outer'`。例如:
```
result = pd.concat([df1, df2], axis=1, join='outer')
```
如果你只想保留两个数据帧中都有的行,可以使用参数 `join='inner'`。例如:
```
result = pd.concat([df1, df2], axis=1, join='inner')
```
希望这些信息能帮到你。
相关问题
不同的pd.DataFrame按照列拼接
我们可以使用`pd.concat()`函数来按照列拼接两个或多个`pd.DataFrame`。
例如:
```
import pandas as pd
df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],
'B': ['B0', 'B1', 'B2', 'B3'],
'C': ['C0', 'C1', 'C2', 'C3'],
'D': ['D0', 'D1', 'D2', 'D3']},
index=[0, 1, 2, 3])
df2 = pd.DataFrame({'A': ['A4', 'A5', 'A6', 'A7'],
'B': ['B4', 'B5', 'B6', 'B7'],
'C': ['C4', 'C5', 'C6', 'C7'],
'D': ['D4', 'D5', 'D6', 'D7']},
index=[4, 5, 6, 7])
df3 = pd.DataFrame({'A': ['A8', 'A9', 'A10', 'A11'],
'B': ['B8', 'B9', 'B10', 'B11'],
'C': ['C8', 'C9', 'C10', 'C11'],
'D': ['D8', 'D9', 'D10', 'D11']},
index=[8, 9, 10, 11])
result = pd.concat([df1, df2, df3], axis=1)
print(result)
```
输出结果:
```
A B C D A B C D A B C D
0 A0 B0 C0 D0 NaN NaN NaN NaN NaN NaN NaN NaN
1 A1 B1 C1 D1 NaN NaN NaN NaN NaN NaN NaN NaN
2 A2 B2 C2 D2 NaN NaN NaN NaN NaN NaN NaN NaN
3 A3 B3 C3 D3 NaN NaN NaN NaN NaN NaN NaN NaN
4 NaN NaN NaN NaN A4 B4 C4 D4 NaN NaN NaN NaN
5 NaN NaN NaN NaN A5 B5 C5 D5 NaN NaN NaN NaN
6 NaN NaN NaN NaN A6 B6 C6 D6 NaN NaN NaN NaN
7 NaN NaN NaN NaN A7 B7 C
两个pd.DataFrame按照列拼接
可以使用 `pd.concat()` 函数来拼接两个 DataFrame。例如:
```
df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],
'B': ['B0', 'B1', 'B2', 'B3'],
'C': ['C0', 'C1', 'C2', 'C3'],
'D': ['D0', 'D1', 'D2', 'D3']},
index=[0, 1, 2, 3])
df2 = pd.DataFrame({'A': ['A4', 'A5', 'A6', 'A7'],
'B': ['B4', 'B5', 'B6', 'B7'],
'C': ['C4', 'C5', 'C6', 'C7'],
'D': ['D4', 'D5', 'D6', 'D7']},
index=[4, 5, 6, 7])
result = pd.concat([df1, df2])
print(result)
```
输出:
```
A B C D
0 A0 B0 C0 D0
1 A1 B1 C1 D1
2 A2 B2 C2 D2
3 A3 B3 C3 D3
4 A4 B4 C4 D4
5 A5 B5 C5 D5
6 A6 B6 C6 D6
7 A7 B7 C7 D7
```
注意,如果两个 DataFrame 有相同的列名,则拼接后的结果会有多个重名的列。可以使用 `ignore_index` 参数来忽略索引,从而避免重名的列。例如:
```
result = pd.concat([df1, df2], ignore_index=True)
print(result)
```
输出:
```
A B C D
0 A0 B0 C0 D0
1 A1 B1 C1 D1
2 A2 B2 C2 D2
3 A3 B3 C3 D3
4 A4 B4 C4 D4
5 A5 B5 C5 D5
6 A6 B6 C6 D6
7 A7 B7 C7 D7
```
还可以使用 `axis` 参数来指定拼接的方向。例如,如果将
阅读全文