现我有两个文件,beijing_wangjing_125_sorted.csv和望京LINE.csv,我想按照第一个文件中的id和第二个文件中的ID值匹配后合并生成一个新的文件
时间: 2024-02-23 15:03:10 浏览: 59
可以使用pandas库中的`merge()`函数来实现两个CSV文件的合并。具体步骤如下:
1. 读取两个CSV文件,保存为两个DataFrame对象。
```python
import pandas as pd
df1 = pd.read_csv('beijing_wangjing_125_sorted.csv')
df2 = pd.read_csv('望京LINE.csv')
```
2. 将两个DataFrame对象按照ID列进行合并,并保存为一个新的DataFrame对象。
```python
merged_df = pd.merge(df1, df2, left_on='id', right_on='ID')
```
其中,`left_on`参数表示合并时使用df1中的哪一列作为合并列,`right_on`参数表示合并时使用df2中的哪一列作为合并列。
3. 将合并后的DataFrame对象保存为一个新的CSV文件。
```python
merged_df.to_csv('merged.csv', index=False)
```
完整代码如下:
```python
import pandas as pd
df1 = pd.read_csv('beijing_wangjing_125_sorted.csv')
df2 = pd.read_csv('望京LINE.csv')
merged_df = pd.merge(df1, df2, left_on='id', right_on='ID')
merged_df.to_csv('merged.csv', index=False)
```
注意,这里假设两个CSV文件中的ID列名分别为'id'和'ID',如果不是的话需要根据实际情况进行调整。
阅读全文