pandas数据合并中的文件合并
时间: 2023-10-02 20:04:40 浏览: 145
在pandas中,文件合并可以通过concat()、merge()或join()等方法实现。这些方法的具体使用方法如下:
1. concat()方法:用于沿着一个轴将多个对象堆叠在一起。它可以按行或列方向进行合并。用法如下:
```python
import pandas as pd
# 读取多个csv文件
df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')
df3 = pd.read_csv('file3.csv')
# 沿着行方向合并
result = pd.concat([df1, df2, df3], axis=0)
# 沿着列方向合并
result = pd.concat([df1, df2, df3], axis=1)
```
2. merge()方法:用于按照指定的列或索引进行连接操作。可以连接多个DataFrame,也可以连接两个DataFrame。用法如下:
```python
import pandas as pd
# 读取两个csv文件
df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')
# 按照指定的列进行连接
result = pd.merge(df1, df2, on='key', how='inner')
```
3. join()方法:用于按照索引进行连接操作。可以连接多个DataFrame,也可以连接两个DataFrame。用法如下:
```python
import pandas as pd
# 读取两个csv文件
df1 = pd.read_csv('file1.csv', index_col='index')
df2 = pd.read_csv('file2.csv', index_col='index')
# 按照索引进行连接
result = df1.join(df2, how='inner')
```
其中,how参数表示连接方式,inner表示取交集,outer表示取并集,left表示取左表中的所有数据,right表示取右表中的所有数据。
阅读全文