import numpy as np import pandas as pd import os os.chdir('D:\Download') F_ = pd.read_excel('FS_Comscfd.xlsx') F = F_.iloc[2:] F = F.fillna(0) F['Tax'] = F['C001021000'] - F['C001012000'] F['LTax'] = F['Tax'].shift(1) F['chtx'] = (F['Tax'] - F['LTax'])/ F['LTax'] F = F[~F.isin([np.nan, np.inf, -np.inf]).any(1)] # F = F.dropna() F = F[['Stkcd', 'Accper', 'chtx']].reset_index(drop = True) F.to_csv("chtx_treated.csv",encoding='utf_8_sig',index = False) F
时间: 2023-09-16 17:12:04 浏览: 139
python数据分析与可视化 import pandas as pd import numpy as np import m
这段代码看起来是在读取一个名为 "FS_Comscfd.xlsx" 的 Excel 文件,并进行一系列的数据处理操作,最后将处理后的结果保存为 "chtx_treated.csv" 文件。
首先,代码导入了一些必要的库,如 numpy、pandas 和 os。然后,使用 `os.chdir()` 将当前工作目录更改为 "D:\Download"。
接下来,使用 `pd.read_excel()` 读取名为 "FS_Comscfd.xlsx" 的 Excel 文件,并将其存储在变量 F_ 中。
然后,进行一些数据处理操作。首先从第三行开始选择数据,并使用 `fillna(0)` 将缺失值填充为0。接着,计算 'Tax' 列的值,该列是 'C001021000' 列减去 'C001012000' 列的结果。然后创建 'LTax' 列,该列是 'Tax' 列向上移动一行。接着计算 'chtx' 列,该列是 'Tax' 列减去 'LTax' 列除以 'LTax' 列的结果。最后,使用 `~F.isin([np.nan, np.inf, -np.inf]).any(1)` 过滤掉包含 NaN、正无穷或负无穷的行。
最后,将筛选后的结果保留 'Stkcd'、'Accper' 和 'chtx' 列,并将结果保存为名为 "chtx_treated.csv" 的 CSV 文件。
如果你有更多的问题,请随时提问。
阅读全文