grouped = df.groupby([ 股票代码 , pd.Grouper(key=df[ 日期 ], freq= Y )])[ 短期负债 , 长期负债合计 , 资产负债率 ].mean()

这是一个 pandas 的 DataFrame 对象 df，使用了 groupby 方法进行分组操作。该语句的含义是：按照股票代码和按年份分组，计算每组的短期负债、长期负债合计和资产负债率的平均值，并将结果存储在一个新的 DataFrame 对象 grouped 中。其中，日期列使用了 pandas 的 Grouper 类进行分组，freq 参数指定了按年份分组。

df['年份'] = pd.to_datetime(df['日期'], format='%Y-%m-%d') grouped = df.groupby(['股票代码', pd.Grouper(key='日期', freq='Y')])['短期负债', '长期负债合计', '资产负债率'].mean() grouped.fillna(grouped.mean(), inplace=True) # 处理缺失值，使用均值填充 result = grouped.groupby( ['股票代码', pd.Grouper(key='日期', freq='Y')]).first().reset_index() # 如果一个企业有多个实际控制人或行业代码，选取第一个数值 result.to_excel('a2.xlsx', index=False, encoding='utf-8') df2 = pd.read_excel('a2.xlsx') def get_lsr(row): code = str(row['股票代码']) a = str(row['实际控制人性质']).split('.')[0] if a in ['1100', '2000', '2100', '2120']: return row['短期负债'] + 0.5 * row['长期负债合计'] else: return row['短期负债'] + 0.4 * row['长期负债合计'] df2['LSR'] = df2.apply(get_lsr, axis=1) df2.to_excel('a2.xlsx', encoding='utf-8') writer = pd.ExcelWriter('a2.xlsx', engine='openpyxl', mode='a') df.to_excel(writer, sheet_name='Sheet1', index=False) writer.save()

这段代码涉及了对财务数据的处理和分析。首先将日期转换为年份，并按股票代码和年份进行分组。对于每个组，计算短期负债、长期负债合计和资产负债率的平均值，并使用均值填充缺失值。然后，对每个股票代码和年份的第一个组进行选择，并输出到Excel文件中。接下来，读取Excel文件，并根据实际控制人性质计算LSR值。最后，将处理后的数据重新保存到Excel文件中，并在同一文件中创建名为'Sheet1'的工作表并将原始数据写入该工作表中。

python 用df.resample后，会添加时间数据

是的，当你使用 `df.resample` 对 DataFrame 进行重采样时，返回的结果中会包含一个新的时间索引。这个时间索引是根据重采样规则生成的，它的取值范围是原始时间索引的最小值和最大值之间的所有时间点。例如，如果你将数据按天进行重采样，那么新的时间索引将包含原始时间索引中的每一天。如果你不需要新的时间索引，可以使用 `groupby` 函数对 DataFrame 进行分组操作，而不是使用 `resample` 函数。例如，如果你想按天对 DataFrame 进行分组，并对每个分组进行聚合操作，可以这样实现： ``` import pandas as pd # 假设 df 是一个 DataFrame，其中包含时间序列数据 df = ... # 将 df 按天进行分组，并对每个分组进行求和操作 df_grouped = df.groupby(pd.Grouper(freq='D')).sum() ``` 这样，`df_grouped` 中将不包含新的时间索引，而是按照天数进行分组的结果，并对每个分组进行了求和操作。需要注意的是，`groupby` 函数的参数是一个 `pd.Grouper` 对象，它表示按照什么频率进行分组。在上面的例子中，`freq='D'` 表示按照天数进行分组。你可以根据需要选择其他的分组频率。

阅读全文

grouped = df.groupby([ 股票代码 , pd.Grouper(key=df[ 日期 ], freq= Y )])[ 短期负债 , 长期负债合计 , 资产负债率 ].mean()

python 用df.resample后，会添加时间数据

相关推荐

group by 按某一时间段分组统计并查询(推荐)

grouped_table.json

pandas之分组groupby()的使用整理与总结

python中groupby date.index

groupby如何以小时划分数据

'The grouper name date is not found'

df1有下单时间，门店编码，各门店门店人数，各个订单的金额字段。现需要计算出各门店一周和一个月的人效，请写出Python代码

python3 表格中的单元格日期

pandas如何对时间格式数据按小时进行聚合并排除日期不同的影响

何使用python將一張表內當天的內容按照分類並分組呈現出來，並合併到之前的數據表上，其中表有數據'線別','{}效率','{}回流數','{}回流率','效率Total', '回流數Total', '回流率Total'，花括號內變量為每天的日期

sata面板数据转换截面数据代码

利用pandas解决以下问题：Input One line: a dict contains "Region", "Date" and "Sales". Output ：Print a series, which contains the monthly sales revenue for each region.

python使用”订单_new.xlsx”中的数据完成统计分析，每周各地的订单记录数量。

读取A.xls中time列中分别统计每年1-3月，4-6月，7-9月，10-12月分别速度、高度、温度、运动量的平均值

2000-2021年中国科技统计年鉴（分省年度）面板数据集-最新更新.zip

最新推荐

2000-2021年中国科技统计年鉴（分省年度）面板数据集-最新更新.zip

高清艺术文字图标资源，PNG和ICO格式免费下载

管理建模和仿真的文件

DMA技术：绕过CPU实现高效数据传输

SGM8701电压比较器如何在低功耗电池供电系统中实现高效率运作？

mui框架HTML5应用界面组件使用示例教程

"互动学习：行动中的多样性与论文攻读经历"

【数据传输高速公路】：总线系统的深度解析

如何结合PID算法调整PWM信号来优化电机速度控制？请提供实现这一过程的步骤和代码示例。

Vue.js开发利器：chrome-vue-devtools插件解析