python csv文件合并
时间: 2023-08-09 19:05:54 浏览: 119
合并csv文件.py
在Python中,可以使用pandas库来合并CSV文件。有两种常见的合并方式:行合并和列合并。
行合并可以使用pandas的concat函数来实现。首先,使用read_csv函数读取要合并的CSV文件,并将它们存储在不同的DataFrame对象中。然后,将这些DataFrame对象放入一个列表中,使用concat函数将它们合并成一个DataFrame对象。最后,使用to_csv函数将合并后的DataFrame保存为一个新的CSV文件。
以下是行合并的示例代码:
```python
import pandas as pd
f1 = pd.read_csv('../data/train_acute.csv')
f2 = pd.read_csv('../data/train_health.csv')
file = \[f1, f2\]
train = pd.concat(file)
train.to_csv("../data/train.csv", index=0, sep=',')
```
\[1\]
如果合并后的CSV文件中出现重复的标题行,可以使用drop_duplicates函数对DataFrame进行去重处理。通过指定subset参数来选择要去重的列,使用keep参数来指定保留哪个重复值,使用inplace参数来指定是否在原DataFrame上进行修改。
以下是去重处理的示例代码:
```python
import pandas as pd
data = pd.read_csv('all.csv')
data.drop_duplicates(subset=\['A', 'B', 'C'\], keep='first', inplace=True)
data.to_csv("all.csv", index=0, sep=',')
```
\[2\]
另外,如果要进行列合并,可以在concat函数中设置axis参数为1。这样,合并后的DataFrame将按列进行合并。
以下是列合并的示例代码:
```python
import pandas as pd
f1 = pd.read_csv('../data/train_acute.csv')
f2 = pd.read_csv('../data/train_health.csv')
file = \[f1, f2\]
train = pd.concat(file, axis=1)
train.to_csv("../data/train.csv", index=0, sep=',')
```
\[3\]
希望这些代码能帮助到你进行CSV文件的合并。
#### 引用[.reference_title]
- *1* *3* [使用python合并csv文件](https://blog.csdn.net/baidu_41217766/article/details/95237049)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item]
- *2* [【工程实践】python 合并多个csv文件](https://blog.csdn.net/weixin_44750512/article/details/128819374)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item]
[ .reference_list ]
阅读全文