如何用python脚本去过滤mysql数据库表中的重复数据保存到文件中
时间: 2024-04-29 08:24:39 浏览: 74
mysql.rar_linux bulk insert
可以使用Python中的pandas和MySQL连接库。首先,将MySQL表中的数据读取到pandas的DataFrame中,然后使用pandas的drop_duplicates()方法根据重复的列名去重,最后再将去重后的数据保存到文件中。以下是示例代码:
```python
import pandas as pd
import pymysql
# MySQL连接配置
conn = pymysql.connect(host='localhost', user='root', password='password', database='test')
# 读取MySQL表中的数据到DataFrame
df = pd.read_sql('SELECT * FROM TABLE_NAME', con=conn)
# 根据重复的列名去重
df = df.drop_duplicates(subset=['column1', 'column2'])
# 保存去重后的数据到文件
df.to_csv('output.csv', index=False)
```
希望对您有帮助!
阅读全文