知识图谱和深度学习相结合的股价预测网络

51 浏览量更新于2024-01-17 收藏 1.94MB PDF 举报

价格预测

深度学习

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

沙特国王大学学报知识图谱和深度学习相结合的一个专注于相关股票和突变点的股价预测网络陶梅瑶a，高珊珊a，b，c，刘晓波，毛德谦a，黄宏aa中国济南山东财经大学b中国山东中美数字媒体国际合作研究中心c山东省数字媒体技术重点实验室阿提奇莱因福奥文章历史记录：2022年3月21日收到2022年5月11日修订2022年5月17日接受2022年5月21日在线提供保留字：知识图谱股价预测突变点分段损失函数A B S T R A C T由于股票市场中多种因素的相互作用，股票价格预测一直是机器学习领域的一特别是股市的突变因素，往往对后续的预测有很大的影响。现有的预测模型很少考虑股票市场中其他股票和突变点对目标股票预测精度的影响。因此，本文提出了一种新的知识图和深度学习方法，结合关注相关股票和突变点的股票价格预测网络。首先，通过ConvLSTM网络获得目标股票价格特征其次，利用知识图挖掘股票之间的隐含关系，找到与目标股票相关的股票，通过ConvLSTM网络获得市场信息向量和市场信息特征。然后，根据价格变化幅度寻找突变点，根据每个交易日到突变点的距离构造突变点距离权重矩阵，通过图卷积网络（GCN）获取突变点信息特征。最后，融合市场信息、突变点信息和目标股价的特征，联合预测未来股价。对2010 - 2019年深市A股的实验结果表明，该算法具有较好的鲁棒性，有效提高了预测精度版权所有©2022作者。由爱思唯尔公司出版代表沙特国王大学这是一个开放的访问CC BY-NC-ND许可证下的文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。1. 介绍由于股票交易的高收益性和高风险性，投资者迫切希望能够准确预测未来股票价格，并据此有针对性地调整投资计划，以获取更大的收益。股票市场是一个复杂的非线性动力系统，受政策、社会新闻事件、公司经营、投资者心理变化等多种因素的因此，股票市场趋势或股票价格的预测是一个极其困难的挑战。*通讯作者：山东财经大学，济南，中国。电子邮件地址：gsszxy@aliyun.com（新加坡）Gao）。沙特国王大学负责同行审查制作和主办：Elsevier为了准确预测股票价格，研究人员提出了许多股票价格预测模型，大致可以分为三类：传统方法、机器学习和深度学习。股票预测的传统解决方案是基于时间序列分析的模型，例如卡尔曼滤波器（Xu和Zhang，2015）和自回归模型及其扩展（Adebiyi等人，2014），例如，自回归模型（AR）、移动平均模型（MA）、自回归移动平均模型（ ARMA ）和自回归综合移动平均模型（ARIMA）。虽然这些传统模型的预测精度已达到一般水平，但也存在局限性，如季节性和非平稳性。因此，基于支持向量机（SVM）和随机森林的机器学习方法正逐步应用于股票预测领域（Das，2021）。然而，这些传统的机器学习方法对复杂的高维数据表现出较差的学习效果和维数灾难为了解决这个问题，已经开发了用于股票预测的深度学习方法（Jiang，2021）。随着深度神经网络在时间序列数据建模、长短期记忆（LSTM ）、卷积神经网络（CNN）和其他模型中的成功（Wei等人，二〇一七年;https://doi.org/10.1016/j.jksuci.2022.05.0141319-1578/©2022作者。由爱思唯尔公司出版代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页：www.sciencedirect.comM. Tao，S. Gao，L. Mao等人沙特国王大学学报4323Sinha等人，2022; Polamuri等人， 2021年）已经成为预测未来股票价格的更有效的解决方案。随着金融市场的发展，企业之间由于各种关系而产生以行业关系为例，企业的发展在很大程度上受其所处行业的影响，因此对一个行业的冲击必然影响到该行业企业的收益尽管已有的金融研究表明，股票价格反映了所有已知的信息（Fama，1965），但大多数现有的模型忽略了其他股票对目标股票的影响。它们只使用单一的目标股票来预测股票价格，这会产生令人不满意的预测结果。考虑到股票市场中多种股票的价格走势相同或相似，股票之间存在相互作用，将一只或多只与目标股票有直接或间接关系的相关股票进行整合，可以更全面地表示股票市场信息。知识图不仅可以描述实体之间的直接关系，而且可以描述隐藏在背景知识中的关系，并且广泛用于金融欺诈、推荐系统等领域（Wanget al.，2018; Wang等人，2018; Wang等人，2019 ），文本分析（ Akimushkin 等人， 2018; Santos 等人，2017）和假新闻分类（Koloski等人，2022），以更好地挖掘不同对象之间隐藏的相关性。因此，本文考虑使用知识图谱来挖掘股票之间的相关性。根据文献（Kang和Xu，2007年），股票价格往往可以被看作是一个平滑的、连续的过程，股票市场在这种条件下稳定运行。但是，由于股票市场容易受到多种因素的干扰，特别是受到一些特殊情况的影响，如国家重大经济政策的调整、股票相关行业的突发事件等，股票价格可能在短期内呈现突变，给股票市场的各项经济活动带来风险，增加了股票价格预测的难度图图1是使用图卷积网络（GCN）模型的股票价格预测的结果曲线（Cerliani等人， 2020年）。图1显示，股票预测结果的总体趋势与实际价格大致相同，但预测结果的准确性在代表大拐点的数据点（图中的红色点我们把图1中的这些点称为突变点。由于股票价格数据的时间连续性，前一时期的股票价格对未来的股票价格有影响，旧的股票价格信息对股票价格预测的影响要弱于最近的股票价格信息。因此，考虑到突变点对每个交易日股价的影响强度不同，我们根据突变点到每个交易日的距离设置权重。突变点越接近交易日，影响权重越大。突变点的存在增加了股票价格预测现有的模型大多采用均方误差作为损失函数，由于突变点的影响，预测值与真实值偏差较大。针对上述问题，本文采用分段损失函数，并在不同区间采用不同形式的损失函数，以增强模型的抗噪能力，提高预测精度。综上所述，本文的主要贡献可归纳如下：针对单个股票不能完全反映市场信息的问题，本文采用知识图和图嵌入技术挖掘股票之间的隐含关系，并计算其相关性。根据股票之间的相关性，与标的相关的股票图1.一、一个GCN模型的股票价格预测结果红点表示突变点。对股票进行加权，构造相应的市场信息矩阵。针对股价预测中突变点附近误差较大的问题，利用股价变化幅度获取突变点，利用突变点与交易日的距离构造突变点权重矩阵，并利用GCN更好地融合时空相关信息。由于股票时间序列数据中突变点的存在，使得训练过程中的误差过大。因此，我们使用分段损失函数和不同的惩罚损失为不同的区间段，以提高模型的预测性能。通过整合上述方法，我们提出了一个知识图和深度学习相结合的股票价格预测网络，专注于相关股票和突变点。实验结果表明，本文提出的模型在股票价格预测任务中表现良好，烧蚀研究证明了模型中的重要组成部分的有效性。2. 相关作品介绍了与本文相关的已有工作。2.1. 股票价格预测方法股票价格预测一直是一个热门的研究课题。随着计算机和人工智能技术的成熟，深度学习模型被广泛应用于股票价格预测。LSTM（Hochreiter and Schmidhuber，1997）代表了一种特殊的递归神经网络（RNN），它不仅可以学习和存储时间序列的上下文信息，还可以解决长时间序列训练过程中的梯度消失和梯度爆炸问题。由于LSTM模型在时间序列上的良好表现，Chen et al.（2015）使用LSTM预测中国股票的收益，收益预测准确率从14.3% 提高到 27.2% 。Wei et al.（2017）使用小波变换对金融数据进行去噪，并结合堆叠自动编码器和LSTM进行金融时间序列预测。Chen et al.（2018）使用基于卷积神经网络的深度学习网络来预测●●●●M. Tao，S. Gao，L. Mao等人沙特国王大学学报4324gfg.Σ.Σee e中国股票市场，其结果优于Gudelek等人的RNN模型的基准。（2017）使用滑动窗口方法，通过在每天的时间段内拍摄受窗口限制的快照来生成图像，然后进行预测。由于LSTM和CNN在股票预测方面都表现出良好的性能，因此参考文献（Replika等人， 2021）结合了LSTM和CNN算法，共同学习时间序列数据的内部趋势。CNN用于提取特征，LSTM用于学习长期和短期依赖关系。在LSTM的基础上，参考文献（Shi et al.，2015）提出了一种ConvLSTM网络，它在LSTM的基础上用卷积结构代替输入到状态和状态到状态的转换，以更好地捕捉数据的时空相关性。Wu等人（2020）首次使用图神经网络研究多变量时间序列，证明了图神经网络在时间序列数据预测中的有效性Cerliani等人（2020）将图卷积神经网络与递归结构相结合来完成销售预测任务。上述研究大多采用单一股票信息进行预测，很少有研究同时关注目标股票和相关股票，忽略了股票之间的相互作用。可以看出，知识图谱具有挖掘不同对象的隐藏相关性的能力受这种方法的启发，我们使用知识图来挖掘股票之间的相关性。2.3. ConvLSTM模型虽然LSTM在时间序列问题上表现良好，但它包含了太多的空间冗余数据，并且没有考虑空间相关性。因此，为了更好地模拟输入fX1;X2;.. . ;XTg，存储单元fC1;C2;。 . . ;CTg，隐态fH1;H2;. ;H T和选通单元i t;f t;. ConvLSTM的t是三维张量。ConvLSTM的结构如图 2，其关键步骤如等式2所示。（一）.ft<$dWfω½Xt;Ht-1]WcfCt-1bfIt<$dWiω½Xt;Ht-1]WciCt-1biNam and Seong（2019）关注目标公司和关联公司的重要性，并根据公司之间的因果关系预测股票走势，证明了关联公司的重要性。Chen等人（2018年）Ct<$ftCt-1itnWcω½Xt;Ht-1]bcot<$dWoω½Xt;Ht-1]WcoCt-1boHto tC tð1Þ合并了目标公司的相关公司信息，提出了一种基于图卷积网络的股票价格联合预测模型。Long等人（2020）提出了一种深度神经网络，通过使用脱敏交易记录和公开市场信息来预测股票价格趋势。Sen和Mehtab（2021）通过将权重分配给其成分股来设计最优投资组合，以实现回报和风险之间的最佳权衡，并获得更高的回报率。受此启发，我们考虑了目标股票和相关股票对未来股票价格的影响，并根据相关程度为不同的股票分配2.2. 知识图知识图谱最早由Google提出，其本质是揭示实体之间关系的语义网络，以图形的形式描述客观事物及其相互关系。客观世界中的实体对应于网络中的实体，实体之间的关系构成网络中的边，可以用（头实体、关系、尾实体）三元组表示。知识图的构建主要是从不同来源、不同结构的数据中提取实体、关系和属性，并对提取结果进行融合，将融合后的知识存储在图数据库中。其次，使用图嵌入技术将知识图中的实体和关系嵌入到低维连续向量空间中（Wanget al.，2014年; Yang等人，2015）来生成用于下游任务的表示向量。知识图以其强大的知识推理能力在许多领域得到了应用。Wang etal.（2018）将知识图集成到推荐系统中，并通过知识图中的链接自动迭代地扩展用户的潜在兴趣来预测最终的点击概率，从而刺激用户偏好在知识实体集上的传播。Cao et al.（2019）提出了一种基于推理的用户偏好模型，通过传递知识图谱中的关系信息，挖掘用户与物品之间的隐含关系，进一步揭示用户对消费物品的偏好。根据上述研究，其中r表示sigmoid函数，0ω0表示卷积。解运算，0 ≠ 0表示Hadamard乘积。2.4. GCN模型GCN（Kipf和Welling，2016）在处理实体之间的空间依赖性方面取得了巨大的成功它们旨在融合节点及其相邻节点的信息，以处理节点之间的空间依赖关系。由于相邻点和更远的点的影响，每个节点改变其状态，直到最终平衡，其中相邻点越近，它们的影响越大该相关信息存储在邻接矩阵中。GCN的本质是一个特征提取器。假设我们有一批包含M个节点的图数据，其中每个节点都有自己的特征，这些特征形成矩阵XX2<$M×K<$ ，其中K是索引号。节点之间的关系形成邻接矩阵A.A2RM×M。其传播方法如等式所示。（二）、Hl1d.D-1=2AD-1=2H1W1其中H是每一层的特征，Hl是层L的特征。对于输入层，H是X。在研究已有工作的基础上，以ConvLSTM网络为基本模型提取股价信息，更好地学习股价序列的时间和空间信息利用知识图和图嵌入技术寻找目标股票的相关股票，了解股票市场的信息特征。3. 模型本文提出了一种知识图和深度学习相结合的股票价格预测网络，专注于相关股票和突变点。网络结构如图所示。目标股票价格（TSP）子网络将目标股票价格信息输入到ConvLSTM模型中，得到目标股票价格特征。（2）股票市场信息（SMI）子网具有相同的网络M. Tao，S. Gao，L. Mao等人沙特国王大学学报4325X.经验eKh×v不不2我明白了。eð Þ2图二. ConvLSTM结构。例如，2016年）。然后，利用余弦相似度算法，根据每只股票的特征向量，计算目标股票与其他股票的相似度，如公式（1）所示。（三）、然后，选择具有最高相似性的前k个股票作为相关股票。在获得相关股票后，我们根据相关股票与目标股票之间的相似性得分计算它们之间的相关性权重，如等式（1）所示。（四）、最后，根据相关性权重对目标股票和相关股票进行加权求和，以获得市场信息向量，如等式（1）所示（五）、ei <$cosvi;vt vi·vtð3Þ结构作为目标股票价格子网络，但其输入是通过知识图获取的目标股票及其相关股票组成的(3)突变点信息（MPI）子网络将目标股价数据和根据各数据点与突变点的距离构造的突变点距离权重矩阵输入到利用GCN模型获得股票价格突变点的特征不我ht¼It1/1vMa× vtbjvij×jvtj. XK .ij！ð4Þð5Þ最后，将这三个子网络融合得到的特征用于预测目标股票的未来价格。3.1. 基于目标股票和相关股票的特征信息网络为了预测下一个交易日的股票价格，我们支付atten-分析了目标股票和相关股票对未来股票价格的影响，并使用基于ConvLSTM的网络模型D td第1页其中，等式中的vi和vt（3）是相关股票i的嵌入表示向量和分别表示目标原料t，并且Ei表示相关原料i和目标原料t之间的余弦相似度。在Eq. （4）表示相关股票的数量，hi表示相关股票i和目标股票t之间的相关权重，vt;v j 在Eq. （5）表示目标的索引向量DD以生成目标股票价格特征向量和市场信息特征向量。3.1.1. 目标股票特征信息子网根据现有的研究（Fama，1965），所有可获得的信息都反映在股票价格中，并且可以通过使用基本价格数据来预测股票价格。本文以收盘价作为预测指标，将过去N个交易日的收盘价输入预测网络，预测目标股票下一个交易日的收盘价。为了更好地预测未来股票价格，本文将股票价格预测描述为时空序列的预测问题，关注股票价格数据的时空信息，并利用能够更好地捕捉时空相关性的ConvLSTM模型，更有效地提取股票价格数据的信息特征如图 4、只提取目标股票的股价特征，将预处理后的目标股票收盘价数据输入到基于ConvLSTM的预测网络中，提取其时空特征，得到目标股票的特征向量。3.1.2. 基于知识图和图嵌入技术的由于知识图可以挖掘实体之间隐藏的关联，因此我们使用知识图在股票市场中找到目标股票的相关股票，并在此基础上获得市场特征向量，如图5所示。首先，我们使用深市A股1481只股票，设计并构建了一个具有多个实体和关系类型的公司知识图谱，可以用三元组表示i;r;j，其中i;jE 和r R. E代表实体的集合，包括公司、行业、概念、省、市、企业、办事处和股东。R表示实体之间的关系，包括位置关系、从属关系和关联。表1显示了一些三联体数据。构建知识图谱后，首先通过node2vec（Grover）获得每只股票的矢量表示股票、相关股票的指数向量和市场信息向量。由于目标股价数据是市场信息数据的一个组成部分，因此可以推断市场信息数据和目标股价数据具有相同或相似的时空关系。因此，为了更准确地获取市场信息数据，将预处理后的市场信息向量输入到基于ConvLSTM的网络模型中，得到市场信息的时空特征向量3.2. 基于突变点检测的通过对股票序列的分析发现，由于股票市场中存在多种影响因素，一个股票时间序列中可能存在一个或多个突变点，具有非线性和不稳定性。通过对现有股票价格预测模型的分析，发现以往的模型对股票价格时间序列数据中的突变点关注不多在此基础上，我们增加了突变点信息子网络，如图所示。六、考虑到我们提出的模型使用前N个交易日的价格信息来预测下一个交易日的收盘价，我们检测了这N个交易日范围内的突变点。首先，我们根据公式计算相邻交易日的价格变化幅度。（6）然后计算N个交易日的平均价格变化。因为股价数据中的突变点是一个突变点，即在突变点的股价与前一个交易日相比出现较大的涨跌。因此，我们定义满足等式的数据点（7）作为股价序列的突变点。更改i¼关闭i-关闭i-16jchangeij>wl7不M. Tao，S. Gao，L. Mao等人沙特国王大学学报4326图三. 网络结构。见图4。目标股票特征信息网络框架。图五. 市场信息网络框架。表1公司知识图谱三倍。i（头部实体）r（关系）j（尾部实体）000001.SZ省广东000001.SZ实业银行000001.SZ概念融券标的股其中，变化i是交易日i和交易日i-1的股价变化量l是交易日N的股价变化量的平均值，并且获得w通过大量的实验。其次，我们构造突变点距离权重矩阵。我们将突变点距离权重矩阵R<$N×N<$初始化为零。然后，突变点的位置是根据Eq.（七）、根据获得的突变M. Tao，S. Gao，L. Mao等人沙特国王大学学报4327...Σ.-××X.-yNN我2见图6。突变点信息子网络（取N = 5，位置1、3、5为突变点）。点位置时，根据每个交易日到突变点的距离更新权重，距离越短，影响权重越大。更新过程如等式所示。（八）、其中，x^y-yp表示实际值与预测值之间的差值;u是通过大量实验获得的。当实际值和预测值之间的误差（0;不... x i-yj。 ;x iyjRP. xi-yj2Pð8Þ小，则梯度（与MSE相同）减小。当实际值和预测值之间的误差较大时，梯度的上限（与MAE相同）为1。相比其中，x i= 1; 2. N表示矩阵的x坐标，并且y j = 1; 2.. N代表矩阵的y坐标。P是突变点的集合。最后，利用广义连通网络提取突变点对股价时间序列数据的影响特征在预测网络中，我们以交易日为节点，以收盘价为节点的特征股票收盘价数据被视为维度为N1的矩阵X。突变点的距离权重矩阵表示每个节点与突变点之间的距离。其构造的主要思想是越靠近突变点的点受突变点的影响越大根据GCN的核心思想，将突变点距离权矩阵看作N维邻接矩阵A，作为输入数据一起输入GCN，以捕捉股价时间序列数据的突变点特征。3.3. 分段损失函数股票价格容易受到股票市场中企业业绩、企业新闻、国家经济政策等多种因素的影响，具有高度的非线性和不稳定性。现有的股票价格预测模型大多基于深度学习使用MSE作为损失函数，无法合理地惩罚突变点附近的股票价格，导致模型的次优解。因此，为了避免突变点的影响导致实际值与预测值之间产生较大的误差，我们的目标是构造一个合理的损失函数，从而使模型收敛到一个更好的情况。根据现有的知识，MSE是一个L2损失函数，可以在任何地方导出，并具有快速收敛速度。当MSE被用作损失函数时，梯度动态地变化，但它被大误差所支配;也就是说，它对离群值敏感。如果存在离群值，则MSE值非常大。平均绝对误差（MAE）是一个L1损失函数。它是一条连续曲线，但在0点不可微，收敛速度慢。当MAE用作损失函数时，所有点的梯度都相同;也就是说，它对离群值不敏感。基于上述分析，由于股票价格存在突变点，我们采用分段损失函数，使用L1损失函数，该分段损失函数可以更快地收敛。与L2损失函数相比，这种分段损失函数对离群值不太敏感，并且梯度变化相对较小，这可以使模型在训练期间更好地收敛。4. 实验本部分介绍了本文所使用的数据集和性能评价指标，并给出了所提出的模型的实验研究和结果分析。为了证明本文提出的模型的普适性，我们选取东阿阿胶（000423.SZ）、云南白药（000538.SZ）、格力电器（000651. SZ）和洋河股份（002304.SZ）作为目标股进行实验，并在实验中选择利用前7个交易日的价格信息来预测次日的收盘价。4.1. 数据集本文的实验数据是通过抓取Tushare1获得的深圳证券交易所股票数据（2010年1月至2019年12月），包括目标股票和相应的相关股票。在爬行数据中，选择最具代表性的接近指数作为输入数据。通过分析，我们发现，2010年至2019年，我国深圳股市共有2431个交易日。虽然都在深交所交易，但由于股票停牌等情况不同，每只股票的总交易天数也不同。因此，为了避免破坏价格运动的实际模型，我们选择了占总交易日90%以上的股票进行实验。对于上证指数，我们使用前一个交易日的收盘价来填充缺失值。表2显示了000651.SZ的一些数据作为目标股票。在获得完整的数据集后，我们将数据集分为训练数据和测试数据，其中90%用作训练数据，其余10%用作测试数据。在数据集被划分之后，我们对数据进行归一化;计算过程如等式所示。（十）、然后，将处理后的数据输入模型。结合MSE和MAE的优点，如等式2所示（九）、Xω¼X-1ð10Þ8>>1nt p;如果jxju<¼1nD其中x表示样本数据，l表示平均值，厌恶标准差。代表>：1X. yt-yp。;否则1/1第1https://tushare.pro/Dð9ÞM. Tao，S. Gao，L. Mao等人沙特国王大学学报4328表2000651的部分数据集交易日密切关闭1.. .关闭9关闭102010-01-0428.1658.2 .31.4512.19.. .. ......你好。. . .. ......你好。.. .. . .2019-12-3165.5889.43 .133.014.314.2. 与其他型号的为了验证我们提出的模型的准确性，我们使用LSTM（Chen etal.，2015）、门控复发单位（GRU）（Huynh等人， 2017），CNN（Chen et al.，2018），双阶段基于注意力的RNN（DARNN）（Qinet al. ， 2017 ）、生成对抗网络（ GAN ）（ Romero ， 2021 ）、BiLSTM-Seq 2Seq （ BiLSTM-S ）（ Mootha 等人，2020 ）、BiLSTM-Multitask （ BiLSTM-M ）（ Mootha 等人， 2020 ）、ConvLSTM （ Lin 等人， 2020 ）、 CNN-LSTM （ Replika 等人，2021）和Wasserstein GAN（WGAN）（Chen Chen和GaoFeng，2021）模型以及我们提出的模型来预测000423.SZ，000538.SZ，000651.SZ，002304.SZ的价格。我们使用MSE、MAE和平均值表3000423的指数比较绝对百分误差1 PN . yt-yp。）以评估1.yt .上述模型，其中yt为真实值，yp为预测值，评价指标得分越小，预测方法的性能越表3表4000538的指数比较各模型中目标股票的评价指标得分， 7方法MSEMaeMAPE显示了股票000651.SZ的预测结果曲线图 7（a）-（k）LSTM2.45301.06100.0128给出了各模型的预测结果曲线和GRU3.02791.21670.0147真正的价格为了更直观地比较CNN2.33231.04100.0125每个模型，我们将不同模型的输出整合到图中的图表中。 7（l）. 更多目标股预测见附录曲线结果。BiLSTM-S2.60671.06370.0129由于同一模型预测的股票价格不同-CNN-LSTM2.32511.04830.0126在表3-6中，我们使用多个结果的平均值，WGAN3.50801.27700.0154实验来表示模型的性能。LSTM和CNN对每只股票都表现出高准确性和良好的性能。通过比较LSTM和CNN两种基本网络与CNN-LSTM和ConvLSTM两种网络模型，我们可以看到LSTM和CNN的结合可以获得更高的预测精度。而且，无论是与基本模型还是改进模型GRU、BiLSTM-M、BiLSTM-S、WGAN、DARNN和GAN相比，本文提出的模型的评价指标得分都是最优的。因此，我们的模型是通用的股票，可以表现出良好的多个股票。图图7和附录显示了实验结果。曲线的走势表明，用上述任何一种方法预测这四只股票时，预测值的走势与实际值的走势大体一致。模型之间的差异主要体现在预测值与真实值的拟合程度上。图1、7为000651. SZ收盘价预测结果曲线。通过两者的比较，我们发现以前的很多方法也都较好地预测了股价的大趋势它们的缺点主要体现在突变点附近预测精度明显下降，拟合度远低于该方法。甚至某些方法预测的突变点后的变化方向也发生了偏离，有效地证明了该方法的有效性。图 7、LSTM、GRU、GAN和BiLSTM-M只预测未来股票价格的一般趋势，而不预测微妙的波动。BiLSTM-S的预测结果整体偏高GRU、DARNN、GAN、WGAN和CNN-LSTM表现出较大的预测延迟问题。CNN和ConvLSTM的预测结果与我们的方法相似，但在突变点附近的拟合程度低于我们的方法。ConvLstm2.28401.06400.0128我们2.16511.02820.0125表5000651的指数比较方法MSEMaeMAPELSTM1.65640.93160.0160GRU2.52561.17220.0199CNN1.35010.83840.0144DA-RNN2.50141.16820.0203GAN1.90210.97930.0168BiLSTM-M1.71660.92840.0159BiLSTM-S1.39931.13210.0197CNN-LSTM1.26970.78940.0136WGAN1.61090.95920.0164ConvLstm1.16480.75500.0130我们1.05470.70600.0123表6002304的指数比较方法MSE MAE MAPE方法MSEMaeMAPELSTM0.56510.49020.0145GRU0.72900.59740.0177CNN0.54590.51570.0153DA-RNN0.87840.62960.0183GAN0.88120.68560.0202BiLSTM-M0.82970.75510.0222BiLSTM-S0.59510.69510.0205CNN-LSTM0.48180.45470.0135WGAN0.71500.58800.0174ConvLstm0.50060.46540.0138我们0.43410.44260.0130DA-RNN6.27821.99100.0241GAN3.62611.34850.0163BiLSTM-M4.12291.64680.0203LSTM5.59491.66180.0151GRU9.11912.08000.0188CNN3.80201.42080.0129DA-RNN11.2662.50210.0228GAN8.36322.05040.0187BiLSTM-M4.67541.58400.0144BiLSTM-S3.65571.71380.0158CNN-LSTM3.93021.38890.0126WGAN6.43811.42660.0164ConvLstm3.74841.42150.0129我们3.41931.36270.0125M. Tao，S. Gao，L. Mao等人沙特国王大学学报4329（a）LSTM（b）GRU（c）CNN(d)DARNN（e）GAN（f）BiLSTM-M（g）BiLSTM-S（h）CNN-LSTM（i）WGAN(j)ConvLSTM（k）OURS（l）见图7。 000651的预测结果FigureB.附录中的8表明，GRU、GAN和WGAN的延迟预测了未来股价的大致趋势，而不预测微妙的波动。DARNN预测的波动大于真实波动，BiLSTM-M和BiLSTM-S的预测结果整体上较低与CNN-LSTM和ConvLSTM相比，我们的预测结果更好地拟合真实值。FigureB. 9表明，GRU，DARNN，GAN，BiLSTM-M和WGAN预测未来股票价格的总体趋势，而不会预测细微的波动。行动。与本文提出的模型相比， LSTM ， CNN ， CNN-LSTM 和ConvLSTM在突变点附近的预测不够准确。FigureB.附录中的10显示，GRU只预测未来股价的大趋势，而DARNN和WGAN只在大趋势的基础上小幅波动。在突变点附近，LSTM，GAN，DARNN，GAN，WGAN和ConvLSTM不能做出很好的预测。BiLSTM-S的总体预测结果偏高。与GRU、DARNN和GAN相比，M. Tao，S. Gao，L. Mao等人沙特国王大学学报4330表7000651的消融实验相关股票突变点分段函数MSEMaeMAPE1.16480.75510.0130p1.09110.72430.0125p1.07300.71630.0128p1.08400.71880.0125p p1.05990.71160.0124p p1.06440.71070.0124p p1.06870.71250.0124p p p1.05470.70600.0123表8002304的消融实验相关股票突变点分段函数MSEMaeMAPE3.74841.42150.0129p3.56581.38920.0126第3.6086页1.38230.0126第3.6123页1.39530.0128p p3.54011.37940.0126p p3.52331.37670.0126p p3.54871.38290.0126p p p3.41931.36270.0125延迟问题和更准确的预测结果。实验结果和分析表明，与已有的模型相比，该方法的拟合度最好，在四种目标股票的价格预测任务中均能取得令人满意的效果。为了进一步分析结果，我们进行了配对t检验，比较我们的方法和其他现有的方法。根据表A。9和附录A中的相应解释，结果表明，我们提出的方法的p值大于显著性水平，最大p值与其他现有模型一致。这意味着接受“两个样本集之间没有差异”的原始假设以及解释预测结果与实际值之间没有显著差异的最佳理由是通过我们的方法实现的。因此，我们的方法具有更高的预测精度。4.3. 烧蚀实验在本节中，为了验证我们提出的相关股票子网络、突变子网络和分段损失函数的有效性，我们对000651.SZ和002304.SZ进行了消融实验，并使用上述四个评价指标对结果进行评价。实验结果示于表7和表8中。在表7和表8中，第一行是基本模型。第2-第5-7行显示了成对组合的执行.最后一行是本文提出的模型。从表7可以看出，仅在基础网络中添加单个模块的模型的性能略好于基础网络，分别提高了0.0918（7.88%）、0.0808（6.94%）和0.0737（6.33%）。与基本网络相比，两两组合模型的性能分别提高了0.1049（9.01%）、0.1004（8.62%）和0.0961（8.25%）。与基本网络相比，我们的模型提高了0.1101（9.45%）。表8显示了仅在基本网络中添加单个模块的模型略好于基础网络，分别增加了0.1398（3.73%）、0.1361（3.63%）和0.1826（4.87%）。与基本网络相比，两两组合模型的性能分别提高了 0.2083（5.56%）、0.2251（6.01%）和0.1997（5.33%）。与基本网络相比，改进后的模型性能提高了0.3291（8.78%）.因此，本文模型中各个模块的有效性通过实验得到了进一步的验证。5. 结论本文首先考虑到单只股票不能完全反映市场信息，通过知识图和图嵌入技术找到目标股票的相关股票。然后，市场信息向量被加权，并作为ConvLSTM网络的输入数据，以获得市场特征。通过分析预测结果发现，突变点附近的模型拟合效果不好。在此基础上，提出了突变点检测子网络，构造了突变点距离权矩阵，并通过广义连通网络进一步获取股价突变特征。最后，综合股价、市场和突变点的特征，联合预测股票的收盘价此外，考虑到现有的-表A.9配对t检验结果。双尾配对t检验LSTM 0.003992 0.001996GRU 1.29982E-05 6.49911E-06美国有线电视新闻网0.002629DA-RNN 0.018765 0.0093830.04412BiLSTM-M0.056511 0.028256BiLSTM-S1.21447E-19 6.07233E-20CNN-LSTM0.215992 0.107996WGANS 0.002989 0.0014950.08086 0.040430.226844 0.113422M. Tao，S. Gao，L. Mao等人沙特国王大学学报4331（a）LSTM（b）GRU（c）CNN(d)DARNN（e）GAN（f）BiLSTM-M（g）BiLSTM-S（h）CNN-LSTM（i）WGAN(j)ConvLSTM（k）OURS（l）图B.8. 000423的预测结果突变点的存在导致预测值与实际值偏差较大，本文采用分段损失函数消除了这种偏差。实验结果表明，该模型进一步提高了预测精度。6. 今后工作未来我们会结合不同类型的信息作为输入（比如更多的市场指标、情绪数据、新闻数据），获取更全面的特征，实现更多准确的股票价格预测。基于不同类型信息的组合，本文初步探索了两种基于本文框架的方法：（1）其他类型的信息与“CLOSE”一起输入(2) 在本文框架的基础上，增加了相关指标子网络，并利用其他类型的信息作为该子网络的输入数据。初步实验表明，（1）的预测性能下降。然而，（2）的预测性能提高。我们认为，M. Tao，S. Gao，L. Mao等人沙特国王大学学报4332数据集中噪声和缺失值的存在影响模型的性能。因此，我们将继续从股价预测的影响因素、数据集处理方法、模型改进等方面进行探索，以完成准确预测股价的目的。竞争利益作者声明，他们没有已知的竞争性财务利益或个人关系，可能会影响本文报告的工作。(a) LSTM（b）GRU（c）CNN(d)DARNN（e）GAN（f）BiLSTM-M（g）BiLSTM-S（h）CNN-LSTM（i）WGAN(j) ConvLSTM（k）OURS（l）图B.9. 000538的预测结果。M. Tao，S. Gao，L. Mao等人沙特国王大学学报4333确认本工作得到国家自然科学基金部分资助（U1909210），山东省自然科学基金重点研发项目（ZR2020MF037，ZR2019MF016，2020CXGC010110，2021SFGC0102）、高校青年创新人才引进与培养计划、济南市科研领军人才工作室（ Z2020025 ）、教育部人文社会科学项目（20YJA870013）。附录A假设：两个样本

下载后可阅读完整内容，剩余1页未读，立即下载