ProgrammingError: Duplicate column name 'a'
时间: 2024-02-09 13:11:56 浏览: 22
这个错误是因为你在给表格添加 `a` 列和 `b` 列时,已经存在了一个名为 `a` 的列。为了解决这个问题,你可以在执行 `ALTER TABLE` 语句之前,先判断表格中是否已经存在 `a` 和 `b` 列,若存在则不再添加。以下是修改后的代码:
```python
import pandas as pd
import mysql.connector
# 连接到 MySQL 数据库
cnx_basic = mysql.connector.connect(user='root', password='09110605',
host='localhost', database='basic')
cnx_daily = mysql.connector.connect(user='root', password='09110605',
host='localhost', database='daily')
# 在 basic 数据库中读取表名
query = "SELECT ts_code FROM stock_basic"
table_names = pd.read_sql(query, cnx_basic)['ts_code']
# 遍历 daily 数据库中的所有表格
for table_name in table_names:
# 给表名加上反引号
table_name = f"`{table_name}`"
# 判断表格中是否已经存在 a 和 b 列
cursor = cnx_daily.cursor()
cursor.execute(f"DESCRIBE {table_name}")
fields = cursor.fetchall()
if ('a', 'float', 'YES', '', None, '') in fields and ('b', 'float', 'YES', '', None, '') in fields:
continue
# 查询表格
query = f"SELECT trade_date, net_mf_amount FROM {table_name} ORDER BY trade_date DESC"
# 查询数据
data = pd.read_sql(query, cnx_daily)
# 计算 a 列的值
data['a'] = data['net_mf_amount'].diff(periods=1)
# 判断是否已经计算过
if 'b' in data.columns:
continue
# 计算 b 列的值
data['b'] = data['a'].diff(periods=1)
# 保存 a 和 b 列的值
query = f"ALTER TABLE {table_name} ADD COLUMN `a` FLOAT, ADD COLUMN `b` FLOAT"
cursor = cnx_daily.cursor()
cursor.execute(query)
cnx_daily.commit()
data[['a', 'b']].to_sql(table_name, cnx_daily, if_exists='append', index=False)
# 关闭连接
cnx_basic.close()
cnx_daily.close()
```
这个代码中,我使用 `DESCRIBE` 语句查询表格的字段信息,然后判断表格中是否已经存在 `a` 和 `b` 列。如果已经存在,就直接跳过,不再执行添加列的操作。这样就可以避免重复添加列名的问题。