在basic数据库中读取stock_basic表格的ts_code列的数据作为表名,给表名加反引号才可以查找 在daily数据库遍历所有表格,对于每个表格 查询net_mf_amount列的数据,按照trade_date降序排列 对查询结果进行pandas计算,a和b列均已存在,不需要判断,对net_mf_amount列的前一天的数据减去今天的数据放在a列,如果之前计算过则跳过得到a列的值 判断是否之前已经计算过,如果已经计算过,则跳过 将a列的值前一天的数据减去今天的数据放在b列 保存a和b列的值 继续处理下一个表格,直到处理完所有表格
时间: 2024-02-09 22:11:58 浏览: 66
好的,你的描述准确明了,下面是基于你的描述编写的代码:
```python
import pandas as pd
import mysql.connector
# 连接到 MySQL 数据库
cnx_basic = mysql.connector.connect(user='root', password='password',
host='localhost', database='basic')
cnx_daily = mysql.connector.connect(user='root', password='password',
host='localhost', database='daily')
# 在 basic 数据库中读取表名
query = "SELECT ts_code FROM stock_basic"
table_names = pd.read_sql(query, cnx_basic)['ts_code']
# 遍历 daily 数据库中的所有表格
for table_name in table_names:
# 给表名加上反引号
table_name = f"`{table_name}`"
# 查询表格
query = f"SELECT trade_date, net_mf_amount FROM {table_name} ORDER BY trade_date DESC"
# 查询数据
data = pd.read_sql(query, cnx_daily)
# 计算 a 列的值
data['a'] = data['net_mf_amount'].diff(periods=1)
# 判断是否已经计算过
if 'b' in data.columns:
continue
# 计算 b 列的值
data['b'] = data['a'].diff(periods=1)
# 保存 a 和 b 列的值
query = f"ALTER TABLE {table_name} ADD COLUMN `a` FLOAT, ADD COLUMN `b` FLOAT"
cursor = cnx_daily.cursor()
cursor.execute(query)
cnx_daily.commit()
data[['a', 'b']].to_sql(table_name, cnx_daily, if_exists='append', index=False)
# 关闭连接
cnx_basic.close()
cnx_daily.close()
```
这个代码中,我先连接到 `basic` 和 `daily` 数据库,然后使用 `SELECT` 语句查询 `stock_basic` 表格的 `ts_code` 列,得到所有表格的表名。接着,我用 `for` 循环遍历所有表格,对每个表格执行以下操作:
1. 给表名加上反引号,避免出现保留关键字等问题;
2. 使用 `SELECT` 语句查询表格的 `trade_date` 和 `net_mf_amount` 列,按照 `trade_date` 降序排列;
3. 使用 pandas 的 `diff()` 方法计算 `a` 列的值,表示 `net_mf_amount` 列每个元素与前一个元素的差值;
4. 判断是否已经计算过 `b` 列,如果已经计算过则跳过;
5. 使用 pandas 的 `diff()` 方法计算 `b` 列的值,表示 `a` 列每个元素与前一个元素的差值;
6. 使用 `ALTER TABLE` 语句添加 `a` 和 `b` 列;
7. 使用 pandas 的 `to_sql()` 方法保存 `a` 和 `b` 列的值。
最后,关闭连接。
阅读全文