用concat函数对两个数据表实现纵向堆叠(内连接、外连接),并且产生新的连接轴索引,同时输出堆叠后的数据表大小。 python
时间: 2024-09-23 21:15:06 浏览: 56
Python数据分析应用:更改数据类型和轴向堆叠数据.pptx
在Python的pandas库中,如果你想将两个数据表(DataFrame)沿纵向上(即行方向)合并,可以使用`concat()`函数结合`join`参数来实现内连接(inner join)或外连接(outer join)。这里假设你有两个DataFrame `df1` 和 `df2`,它们有共同的列名作为连接键。
1. 内连接(inner join)示例:
```python
merged_df = pd.concat([df1, df2], axis=0, join='inner', ignore_index=True)
```
在这个例子中,`axis=0`表示按行堆叠,`ignore_index=True`会创建一个新的索引,以便每个数据表原有的索引被忽略。
2. 外连接(outer join)示例:
```python
merged_df = pd.concat([df1, df2], axis=0, join='outer', ignore_index=True)
```
`join='outer'`会让结果包含所有源数据表的数据,缺失值会被填充NaN。
堆叠后的数据表大小可以通过`.shape`属性获取,它返回一个元组,第一个元素代表行数(即数据表的大小),第二个元素代表列数。
```python
data_size = merged_df.shape[0]
```
阅读全文