其中Stkcd为股票代码,Accper为截止日期,F090301B为归属于母公司每股收益,F090601B为每股营业收入,F091001A为每股净资产,F091301A为每股资本公积,F091501A为每股未分配利润,F091801B为每股经营活动产生的现金流量净额。问题如下: (1)对每个股票代码,计算每个季度每股收益同比增长率,并找出连续4个季度每股收益同比增长率大于20%的股票代码。 (2)找出2017年、2018年每股资本公积和每股未分配利润最大的10只股票代码,并通过柱状图、子图的方法可视化展现出来。 (3)取2018年的数据,对以上6个指标做主成分分析,要求提取信息占比在95%以上,并写出每个主成分的表达式,说明其主成分的意义。 (4)基于第3步提取的主成分进行K-均值聚类分析,并获取聚类中心。
时间: 2024-04-27 08:24:46 浏览: 213
上市公司财务指标每股指标1990-202406的网盘链接.docx
好的,针对您的问题,我先给出一些思路和解释:
(1)计算每股收益同比增长率,可以通过计算相邻两个季度的每股收益的增长率来实现。比如第二个季度的每股收益同比增长率可以用以下公式计算:
$GrowthRate = \frac{EPS_{Q2}-EPS_{Q1}}{EPS_{Q1}} \times 100\%$
其中$EPS$表示每股收益,$Q1$表示第一个季度,$Q2$表示第二个季度。如果要找出连续4个季度每股收益同比增长率大于20%的股票代码,可以对每个股票的每个季度的增长率进行判断,如果有连续的4个增长率都大于20%,则认为该股票符合条件。
(2)找出2017年、2018年每股资本公积和每股未分配利润最大的10只股票代码,可以对每个股票的每股资本公积和每股未分配利润进行排序,然后取出前10个即可。柱状图和子图的方法可以用Python的Matplotlib库实现。
(3)取2018年的数据,对以上6个指标做主成分分析,可以使用Python的sklearn库实现。主成分分析是一种常用的数据降维方法,可以将多个相关的指标变成少数几个无关的主成分,以便更好地分析数据。提取信息占比在95%以上,可以通过观察每个主成分对原始数据方差的解释程度来确定。每个主成分的表达式和意义,可以通过查看主成分分析结果中的因子载荷矩阵来确定。
(4)基于第3步提取的主成分进行K-均值聚类分析,并获取聚类中心,可以使用Python的sklearn库实现。K-均值聚类是一种常用的无监督学习方法,可以将数据集中的样本分成K个簇。聚类中心是每个簇的中心点,可以通过均值来计算。
阅读全文