import numpy as np import pandas as pd #%% FSC = pd.read_excel('D:\文档\pythonProject\FS_Comins.xlsx') FSC = FSC.iloc[2:] FSC = FSC.rename( columns = {'B001100000': 'TSale', 'B002100000': 'Tax'}) FSC = FSC.fillna(0) #%% FSC = FSC[['Stkcd','Accper','TSale']] FIT = pd.read_excel('D:\文档\pythonProject\FI_T10.xlsx') FIT = FIT.iloc[2:] FIT['Ind'] = FIT['Indcd'].apply(lambda x: x[0]) IND = FIT[['Stkcd','Accper','Ind']] #%% def My_year(Set,YMD): Set[YMD] = pd.to_datetime(Set[YMD],format='%Y-%m-%d') Set['year'] = Set[YMD].dt.year My_year(FSC,'Accper') My_year(IND,'Accper') #%% HE2 = HE[['Ind','Accper','TSale'] ].groupby(['Ind','Accper'] ).sum().reset_index() HE2 = HE2.rename( columns = {'TSale': 'TSale_sum'}) #%% HE = pd.merge(HE,HE2,on=['Ind','Accper'],how='left') HE['TSale_r'] = HE['TSale'] / HE['TSale_sum'] HE['TSale_r2'] = HE['TSale_r'] **2 #%% HE3 = HE[['Ind','Accper','TSale_r2'] ].groupby(['Ind','Accper'] ).sum().reset_index() HE3 = HE3.rename( columns = {'TSale_r2': 'herf'}) HE3.to_csv( "HE_herf_treated.csv",encoding='utf_8_sig',index = False)
时间: 2023-09-13 07:04:40 浏览: 158
这段代码是用来读取Excel文件并进行数据处理的。首先,使用`pd.read_excel()`函数读取名为'FS_Comins.xlsx'的Excel文件,并将数据存储在名为`FSC`的DataFrame中。然后,对数据进行一些处理,如删除前两行、重命名列、填充缺失值等。接下来,选择`FSC`中的'Stkcd'、'Accper'和'TSale'列,并将其存储在`FSC`中。
同样的步骤也适用于另一个Excel文件'FI_T10.xlsx',将数据存储在名为`FIT`的DataFrame中。
接下来定义了一个名为`My_year`的函数,用于将日期格式转换为年份,并将其应用于`FSC`和`IND`的'Accper'列。
然后,对`HE`进行了一些数据处理操作,包括对'TSale'列按'Ind'和'Accper'分组求和,并将结果存储在名为`HE2`的DataFrame中。然后,将`HE2`与原始的`HE`进行合并,并计算'TSale'的相对值和平方值,分别存储在'TSale_r'和'TSale_r2'列中。
最后,对'TSale_r2'列按'Ind'和'Accper'分组求和,并将结果存储在名为`HE3`的DataFrame中。最后,将`HE3`保存为CSV文件'HE_herf_treated.csv'。
这段代码主要是数据处理的部分,可能是为了后续的分析和计算做准备。
阅读全文