沙特国王大学学报：基于混合预测算法的股市价格预测应用-多模型生成式对抗网络（MMGAN-HPA）

55 浏览量更新于2024-01-17 收藏 1.69MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

沙特国王大学学报多模型生成式对抗网络混合预测算法（MMGAN-HPA）在股市价格预测中的应用苏巴·拉奥·波拉穆里博士Kudipudi Srinivasb，Dr.A. 克里希纳·莫汉c印度AP Kakinada JNTUK CSE系研究学者b印度AP维杰亚瓦达V.R.悉达多工程学院CSE系教授c系教授CSE、UCEK、JNTUK、Kakinada、AP、印度阿提奇莱因福奥文章历史记录：收到2021年2021年6月9日修订2021年7月2日接受2021年7月7日在线发布保留字：深度学习生成对抗网络（GAN）递归神经网络（RNN）卷积神经网络（CNN）股市分析A B S T R A C T深度学习在优化与人工智能（AI）相关的解决方案方面取得了更大的成功。在金融领域，它被广泛用于股票市场预测，交易执行策略和投资组合优化。股票市场预测是该领域中非常重要的用例。具有先进AI模型的生成对抗网络（GAN）最近获得了重要意义。然而，它被用于图像-图像-翻译和其他计算机视觉场景。GAN在股市预测中的应用并不多，因为它很难设置正确的超参数集本文采用强化学习和贝叶斯优化的方法来利用生成器和递归实现了一个基于GAN的深度学习框架Stock-GAN前者是用LSTM实现的，LSTM是递归神经网络（RNN）的一种变体，而后者使用卷积神经网络。提出了一种基于生成对抗网络的混合预测算法（GAN-HPA）。一项实证研究表明，股票GAN在股票价格预测方面取得了令人鼓舞的表现，与最先进的模型相比，称为基于多模型的混合预测算法（MM-HPA）。之后，MM-HPA和GAN-HPA结合形成了另一种称为MMGAN-HPA的混合模型，以提高MM-HPA和GAN-HPA的性能。版权所有©2021作者。由爱思唯尔公司出版代表沙特国王大学这是一个开放的访问CC BY-NC-ND许可证下的文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。1. 介绍股票市场行为预测是投资者和所有股票市场利益相关者感兴趣的问题。深度学习模型被证明是股票价格预测研究中有前途的替代方案，因为它们取得了巨大的成功（Zhang et al.，2019年）。股票市场的技术分析揭示了股票投资组合的趋势。许多经典算法，如自回归综合移动平均（ARIMA）（Nau，2014）应运而生。然而，它们是线性模型，并且由于股票市场数据本质上是揭示时间维度的时间序列而遭受性能问题。线性模型与传统的机器学习方法，如支持*通讯作者。电子邮件地址： gmail.com （ S.R.Polamuri ）， vrdrks@gmail.com（D.K.Srinivas），krishna. gmail.com（D.A. Krishna Mohan）.沙特国王大学负责同行审查制作和主办：Elsevier向量机（SVM）用于预测（Polamuri等人，2019年）。在（Asad，2015）中探索的包围模型可以提供更好的性能。然而，Vargas et al.（2017），Akita et al.（2016），Mai et al.（2019），Liu et al.（2018），Eapenet al.（2019）和Katayama et al.（2019）优于传统的机器学习模型。CNN 在 Hoseinzade 和 Haratizadeh （ 2019 ），Zhang et al.（2019），Sezer和Ozbayoglu（2018），Tsantekidis etal.（2017）中进行了研究，CNN与LSTM组合被探索用于股票价格预测。LSTM被用于（Nelson例如，2017）和（Bukhari et al.，2020）作为RNN的变体，用于克服丢失梯度的问题。在Chen et al.（2020）中，提出了混合深度学习模型，并发现其更有效。在Polamuri等人（2020）中，线性和非线性模型都被结合起来，以获得更好的预测精度。现有的深度学习模型中有许多见解，导致了本文中进行的研究。首先，CNN更适合分类。其次，LSTM可以比RNN更好地捕获时间数据变化（Vargas等人，2017年）。第三，深度学习模型缺乏预处理（或数据质量），除非有一种有效的基于NLP的特征选择方法（Bukhari et al.，2020年）。第四，GAN在使用无监督的https://doi.org/10.1016/j.jksuci.2021.07.0011319-1578/©2021作者。由爱思唯尔公司出版代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页：www.sciencedirect.comS.R. Polamuri，D.K. Srinivas，D.A. KrishnaMohan沙特国王大学学报7434方法除了生成类似于真实数据的新数据之外（Zhang等人， 2019年）。第五，线性和非线性模型的混合可以在存量预测中提供更好的性能（Polamuri等人，2020年）。第六，需要一个基于GAN的框架，利用CNN，LSTM和新颖的预处理来改进现有技术。考虑到这些观察结果，在本文中，我们提出了一个基于深度学习模型的框架，称为Stock-GAN，用于更好地预测股票市场。该框架使用LSTM作为生成器，CNN作为判别器。有强大的特征提取程序，从股票数据中的线性模型，如ARIMA应用。新颖的预处理方法被集成为Stock-GAN的一部分。研究了适合于（G）和（D）的右超参数集.为了动态地调整超参数，Stock-GAN结合了强化学习框架和贝叶斯优化技术。特征提取过程导致如此多的特征，并且所有这些特征都可能对股票预测过程没有贡献。为了过滤掉它们（降维/特征选择），使用XGBoost来识别特征的重要性。然后应用PCA并创建特征组合，以减少由自动编码器生成的特征的数量。第4节深入研究Stock-GAN的更多细节。我们在本文中的贡献如下。1. 提出了一种称为Stock-GAN的深度学习框架，用于预测股票价格。Stock-GAN是用LSTM作为生成器，CNN作为递归来实现的。2. 提出了一种基于生成对抗网络（GAN）的混合预测算法（GAN-HPA），通过新的特征选择实现并提高了Stock-GAN的性能。3. 使用Python数据科学平台构建了一个原型应用程序来评估GAN-HPA，并将其与另一种基于深度学习的混合算法MM-HPA进行了比较。4. MM-HPA和GAN-HPA结合形成了另一种称为MMGAN-HPA的混合模型，以提高MM-HPA和GAN-HPA的性能本文其余部分的结构如下。第2节回顾了有关股票市场预测的先进数据科学概念的文献。第3节说明了GAN架构及其底层数学模型。第4节描述了所提出的Stock-GAN架构及其算法。第5节介绍了从印度国家证券交易所收集的七个股票报价机的实验结果。第6节总结了论文，并为未来的研究范围提供了方向2. 相关工作本节回顾了有关股票市场预测的高级数据科学概念的文献。Vargaset al.（2017）研究了CNN和RNN架构，用于基于金融新闻数据预测股市。他们发现RNN更适合于确定时间特征，而CNN更适合于从文本中获取语义。他们打算在未来使用强化学习来获得更好的性能。Hiransha等人（2018）研究了四种深度学习模型，如CNN，LSTM，RNN和MLP（多层感知器），用于预测股票价格。他们发现，深度学习模型比ARIMA等非线性模型更好。 Akita等人（2016）使用了LSTM以及从股票价格预测的新闻文章中生成的段落向量的概念。Chen等人（2018）将径向基函数神经网络、极端学习机和反向传播神经网络等三种传统方法与深度学习进行了比较，发现深度学习模型表现出更好的预测能力能力的Pang等人（2020）使用带有嵌入层的LSTM来预测股票市场。Zhang et al.（2019）提出了一种用于股票市场预测的GAN架构，其中LSTM作为递归，MLP作为生成器。他们打算在未来通过更准确地学习数据分布来优化模型。Nelson等人（2017）研究了LSTM网络来预测股票市场。Akita et al.（2016）使用金融数据的深度学习模型来预测破产。Hoseinzade和Haratizadeh（2019）提出了一个基于CNN的股票预测框架。Zhang et al.（2019）提出了一种具有LSTM和卷积层的深度学习模型，用于处理限序图书（LOB）的数据。他们的方法在特征提取和建模方面表现出更好的性能。Polamuri等人（2020）将CNN模型和表示学习模型结合起来进行股票预测。 Sezer 和 Ozbayoglu（2018）提出了一种基于2-D CNN的交易模型CNN-TA，用于确定持有和出售策略。Zhang et al.（2018）提出了一种新的股票市场预测方法，融合了不同来源的信息。Chen等人（2020）提出了基于LSTM、MLP和注意力机制的混合深度学习模型。结果表明，该模型具有较好的预测精度。然而，他们打算在未来用情感模型来改进它。Tsantekidis等人（2017）提出了基于CNN的深度学习模型，以使用LOB数据确定股票的走势Asad（2015）提出了一种股票市场预测的集成采用Meta学习算法实现SVM、随机森林和相关向量机分类器的集成.他们观察到集成方法的错误率最低。 Eapen等人（2019）提出了一种深度学习模型，将双向LSTM和CNN结合起来进行股指预测。他们可以提高预测性能的混合方法。Bukhari等人（2020）提出了一种改进的ARIMA，并将其与LSTM结合用于股市预测。他们的模型可以提高预测的准确性。Katayama等人（2019）提出了一种基于情绪极性识别的深度学习模型，用于金融市场预测。他们的方法可以改善基于极性的市场预测。Lee et al.（2019）专注于基于深度Q网络的深度学习模型，CNN作为函数逼近器，股票图表作为股票预测的输入。Polamuri等人（2020）提出了MM-HPA，这是一种混合算法，结合了线性和非线性预测模型以获得更好的性能。从文献中有几个见解。首先，CNN更适合分类。其次，LSTM可以比RNN更好地捕获时间数据变化（Mai等人，2019年）。第三，深度学习模型缺乏预处理（或数据质量），除非有一种有效的基于NLP的特征选择方法（Bukhari et al.，2020年）。第四，发现GAN除了生成类似于真实数据的新数据之外，还可以使用无监督方法有效地学习数据的内部表示（Zhanget al.，2019年）。第五，线性和非线性模型的混合可以在股票预测中提供更好的性能（Rao等人，2020年）。第六，需要基于GAN的框架，利用CNN，LSTM和新颖的预处理来改善最新技术水平。考虑到这些观察结果，本文提出了基于深度学习模型的Stock-GAN，以更好地预测股票市场。3. 预赛使用股票市场数据预测股票价格走势是不平凡的。2014年，IanGoodfellow和他的同事们提出了一类机器学习框架，称为生成对抗网络（GAN）。这是一个博弈论环境，两个神经网络相互竞争GAN学会了S.R. Polamuri，D.K. Srinivas，D.A. KrishnaMohan沙特国王大学学报7435NZn不我不我我N我我X从训练集生成与训练集相似的新数据。GAN的架构如图1所示。它有两个重要的组成部分，如发电机（G）和整流器（D）。‘‘Genera- tor ismodel used to generate new plausible examples from the problemdomain while the discriminator is a model used to classify examplesas real (生成器网络直接生成看起来像真实数据的数据样本。另一方面，它的对手，称为神经网络，区分从真实数据中获得的样本和生成器框架生成的样本。判别器是一个分类模型。如（Uddin，2019）中所讨论的，GAN架构的目标函数在等式中（一）.描述了图2所示的被称为Stock-GAN的所提出的框架。4.1. 框架与GAN IN中MLP扮演生成器的角色不同，LSTM更适合在Stock-GAN中实现生成器，而CNN则用作生成器。这背后的基本原理是，LSTM可以很好地处理时间序列数据，并且与RNN相比，它能够学习长期依赖关系，而CNN则适合分类。混合模型与线性和非线性预测方法被发现有效的股票预测。所以除了minargGMaxDVD;GEx~pdataxlgDx]Ez~pz z通过在Stock-GAN中分别使用LSTM和CNN作为生成器和卷积，可以从股票数据中提取强大的特征，其中应用了ARIMA等线性模型。新颖的预处理方法（Polamuri等人，2020年）被整合为其中，将该函数表示为D（x）。该函数导致表示为x的输入向量来自训练数据集的概率。通过将x作为输入，D（x）产生一个介于0和1之间的值。类似地，G（z）被称为生成器函数，其导致其维度与x的维度相同的矩阵，取决于z（噪声向量）。从训练数据集中，样本的概率分布表示为Pdata（x）。从噪声发生器获得的样本的概率分布表示为Pz（z）。由对数损失函数作为正类得到的期望函数记为E（. ）.对数损失函数定义为等式（1）。（二）、Epjyl-1ylogp1-y1-p21/1其中实际数据表示为yi，估计表示为pi。当0或1被预期为来自模型的响应时，使用log函数。当x从p（x）中得出时，关于概率分布p（x），给定函数f（x）的E（f（x））表示为等式（1）。（三）、股票的一部分。否则，深度学习模型会遇到性能问题。我们研究了适合于（G）和（D）的超参数集. 为了动态调整超参数，Stock-GAN结合了强化学习框架和贝叶斯优化技术。一种新的预处理方法用于在将数据提供给（G）之前提高数据的质量。NLP的最新创新是方法的一部分。例如，BERT用于观察情绪。趋势方向确定使用四阶变换。高级特征使用堆叠的自动编码器提取。股票函数近似是用线性学习模型ARIMA来实现的自组织映射（SOM ）是用来分析股票运动的异常。这些信息稍后对LSTM（G）有用进行了统计检查，以确保数据质量高。特征提取过程导致如此多的特征，并且所有这些特征都可能对股票预测过程没有贡献为了过滤掉它们（降维/特征选择），XGBoost用于识别特征的重要性。然后应用PCA并创建特征投资组合以便减少由自动编码器生成的特征的数量Ex~pf该方法中使用的傅立叶变换产生一系列正弦波来分析趋势方向。变换如在Eq. （四）、两个循环，如minGV（D，G）和maxDV（D，G），涉及方程。（一）. maxDV（D，G）的目标是通过参数调整使右手边最大化方程（1）是目标函数，其包含表示maxDV（D，G）和minGV（D，G）的两个循环。类似地，minGV（D，G）的目标是通过发电机的参数调整来最小化4. 拟议的Stock-GAN框架基于GAN的生成器（G）和生成器（D）的方法被发现适合于有效地处理时间序列股票市场数据。没有标记的数据，GAN可以快速学习数据的内部表示，生成数据，学习密度分布，并使用经过训练的神经网络作为分类器。在本节中，Gf1gte-i2pftdt4-1ARIMA（Nau，2014）用于了解股票趋势并提取新的特征或模式，如等式2所示。（五）、1-k1ARIMA是ARMA的一种改进形式，能够更好地逼近真实的股票价格。在使用自动编码器提取高级特征之后，XGBoost（Lee等人，2019）用于特征重要性预测的模型如等式（1）中所示。（六）、我不知道。yi;ytt-1fXXf6t1/2Fig. 1.典型GAN模型的架构。S.R. Polamuri，D.K. Srinivas，D.A. KrishnaMohan沙特国王大学学报7436图二. Stock-GAN的架构（G）和（D）的组合损失函数如等式（1）所示。（七）、LD;GEx~prx½logDx]Ez~pz½logg1- DGz]7由于RNN多次使梯度消失，LSTM被用作（G），其中使用了四个门，即更新门，输入门，遗忘门和输出门。LSTM优于GRU（门控循环单元），因为LSTM有4个门，具有内部存储器状态并支持非线性。等式8到13显示了LSTM涉及的数学模型。g t¼tanh。X t W xgh t-1W hg b g8itrXtWXiht-1Whibi9f t¼r.Xt Wxfht-1Whfbf10ot¼r XtWxoht-1Whobo11ct<$ftct-1itgt12S.R. Polamuri，D.K. Srinivas，D.A. KrishnaMohan沙特国王大学学报7437Rt¼ð—Þð—Þ联系我们P.ΣΣΣ;···· ··htottanhct13LSTM模型中使用的两个激活函数如等式2所示。（14）和（15）。已经被证明是准确的。因此，除了在Stock-GAN中使用LSTM和CNN作为生成器和递归外，还可以从股票数据中提取鲁棒的特征，该过程采用ARIMA等线性模型Stock-GAN包含一个联系我们1 1吨1张经验图-x1张经验图-xk1-expð14Þ新的预处理技术。另一方面，深度学习模型存在性能问题。我们研究了（G）和（H）（D）的最佳超参数集。Stock-GAN包括一个可动态调整超参数联系我们1个 1- 2x1个; 1个 1- 2x1个ð15Þ一种名为生成对抗网络（GAN）的图3所示的CNN架构被用作（D）。由于其处理空间数据的能力和检测特征的能力等原因，它是优选的。如图所示。 3、CNN具有区分和分类数据的机制。换句话说，它用来预测股票价格。LSTM（G）和CNN（D）都需要超参数，包括滤波器数量（filters ）、LSTM 中使用的dropout（dropout）、CNN中的内核大小（kernel_size）、CNN中的填充（padding）、CNN中使用的批量归一化动量（batchnormalization momentum）、GNN中LeakyReLU所需的alpha参数（lrelu_alpha）、CNN所需的步长数量（strides）、CNN所需的学习率（cnn_lr）、CNN和LSTM所需的批量大小（batch_size）。这些都是通过使用深度学习和贝叶斯优化技术跟踪和优化的。四、4.2. 基于生成对抗网络的混合预测算法针对基于RNN的非线性或深度学习模型，提出了基于多模型的混合预测算法（MM-HPA）、MAE和MSE值。误差率非常低，表明该模型在预测股票收益方面具有很高的性能。每天的回报预测的训练和测试数据的错误率最小。预测回报率和目标回报率之间的相关性非常高。模型的相关性越高，模型的性能越好。所有股票报价机在MAE，MSE和相关性方面。实验结果表明，该算法具有较高的相关性和较低的误码率。这背后的原因是，与RNN相反，LSTM更擅长处理时间序列数据和学习长期依赖性，而CNN更擅长分类。在股票预测中，线性和非线性预测方法的混合预测算法（GAN-HPA）来实现股票GAN框架。算法：基于生成对抗网络的混合预测算法输入包含实际股票价格的股票数据集D超参数H输出预测股价D步骤1：使用傅立叶变换G（f）=1gte-i2pftdt-1步骤2：使用ARIMA（线性模型）查找预测1k1B1k2Byt1htBet第3步：对第1步和第2步的结果应用堆栈自动编码器第5步：使用XGBoost查找特征重要性（输出给生成器）Ltn1lyi;ytt-1ftXiXft步骤6：每次迭代直到收敛第7步：使用LSTM作为生成器进行深度学习（获取第5步的输出和超参数）第8步：CNN作为神经网络（采用真实的股票价格和LSTM预测）第9步：计算发电机和发电机的组合损失函数L（D，G）=Ex~prxl/2logD（x）]+Ez~pzz[log（1-D（G（z）]第10步：调整超参数H（接下页）图三. CNN的架构S.R. Polamuri，D.K. Srinivas，D.A. KrishnaMohan沙特国王大学学报7438BBX.b.2.2-2.3Þ½Xb½j-jÞ算法（续）算法：基于生成对抗网络的混合预测算法步骤11：更新D第12步：结束步骤13：计算错误率算法（续）算法：多模型生成式对抗网络混合预测算法2. 将F初始化为1（非线性预测模型的数量）3. 对于E中的每个预测模式e步骤13：返回D4. 求rt;Li表示为线性预测6. 找到rt;NLj7. 端8. 端表示为非线性预测算法1：. 基于生成对抗网络的混合预测算法如算法1所示，它采用不同的输入，如股票数据集和超参数，并为给定的股票报价机数据集生成预测。在步骤1中，股票价格趋势近似使用傅立叶变换。如前所述，傅立叶变换是处理时间序列数据的较好技术。在第2步中，ARIMA被用来找到股票预测，并被进一步重用。通过这两个步骤，大部分特征都是从股票数据集中提取的。然而，要去除特征中的噪声。在步骤3中应用堆叠式自动编码器，以实现它并确保最终的功能集。在这个阶段，重要的是减少维数。在步骤5中使用XGBoost来找到具有区分能力的特征的重要性。这个结果和超参数作为生成器（LSTM）的输入。生成器的结果和原始库存数据被提供给客户端。迭代器对数据进行分类，并且从步骤6到步骤12的迭代过程继续进行，直到收敛。在该过程中，在步骤10中使用贝叶斯近似调整参数，并在步骤11中更新预测。最后，该算法除了评估错误率之外还返回最终预测。4.3. GAN-HPA和MM-HPA进一步研究了MM-HPA的优良特性，并将其与GAN-HPA相结合。将GAN-HPA和MM-HPA适当结合的混合算法在图中被命名为多模型生成对抗网络混合预测算法（MMGAN-HPA）。四、算法：多模型生成式对抗网络混合预测算法输入股票市场数据集表示为rt（t =1，， T）超参数H输出预测股价D1. 将E初始化为2（线性预测模型的数量）图四、MMGAN-HPA的架构9. 每次迭代直到收敛10. 使用LSTM作为生成器的深度学习（使用步骤4和步骤5到步骤7的结果以及超参数）11. CNN作为神经网络（采用真实的股票价格和LSTM预测）12. 计算生成器和鉴别器的联合损失函数 L （ D ， G ）=Ex~pr<$x<$logD（x）] +Ez~pz <$z<$[log（1- D（G（z）]13. 调整超参数H14. 更新D15. 端16. 计算错误率17. 返回D算法2：. 多模型生成式对抗网络混合预测算法算法2以股票数据集为输入，并在GAN方法之前进行了预处理.在预处理步骤（步骤1至步骤8）中，该算法采用线性和非线性模型，以便从数据集中提取特征。关于用于获得特征的线性和非线性模型的更多信息，在我们之前的工作中可以找到。预处理和超参数的结果作为生成器（LSTM）的输入。给出了生成器的输出和原始库存数据的判别结果.迭代器对数据进行分类，并且从步骤9到步骤15的迭代过程继续，直到收敛。在该过程中，在步骤16中使用贝叶斯近似调整参数，并在步骤17中更新预测。最后，算法返回最终的预测，除了评估错误率。4.4. 评估指标GAN-HPA模型的性能使用诸如平均绝对误差（MSA）和均方误差（MSE）的度量来评估，如在等式（16）和（17）。MAE1 y y16nMSE1 年2年17n利用这些度量，计算预测误差以确定混合预测模型的性能。5. 实验结果Stock-GAN 框架使用 Python 数据科学平台实现。 TCS 、 TataSteel、Axis Bank、BHEL、Wipro和Maruti等各种股票报价机的股票数据集都是从NSE（国家证券交易所）收集的。5.对于FS.R. Polamuri，D.K. Srinivas，D.A. KrishnaMohan沙特国王大学学报7439表1GAN-HPA的性能股票代码GAN-HPA的表现MaeMSE相关性TCS0.002633970.000034900.99586647BHEL0.002670970.000022900.99686559Wipro0.002396970.000024000.99716163AXISBANK0.002803960.000030200.99837178马鲁蒂0.002217970.000021600.99721564塔塔斯泰尔0.004634940.000067700.99736265图五. Axis Bank数据集的预测性能。见图6。 BHEL数据集的预测性能。见图7。Maruti数据集的预测性能。5.1. GAN-HPA的结果GAN-HPA的股票预测性能使用第4.3节中提供的指标进行评估。它与见图8。Tata Steel数据集的预测性能。见图9。 TCS数据集的预测性能见图10。 Wipro数据集的预测性能。另一种基于深度学习的混合预测模型称为MM-HPA。如表1所示，GAN-HPA的预测性能提供了所有股票报价机的MAE，MSE和相关性。高相关性和低误码率反映在结果表明所提出的算法的性能。如图所示。图5中，水平轴提供时间轴，而垂直轴示出股票价格。实际股票价格与预测股票价格之间有很好的匹配，从而反映了股票价格预测的最小误差率。S.R. Polamuri，D.K. Srinivas，D.A. KrishnaMohan沙特国王大学学报7440图十一岁MMGAN-HPA算法的预测结果如图所示。图6中，水平轴提供时间轴，而垂直轴示出股票价格。实际股票价格与预测股票价格之间有很好的匹配，从而反映了股票价格预测的最小误差率该预测基于BHEL数据集。如图所示。在图7中，水平轴提供时间轴，而垂直轴示出股票价格。实际股票价格与预测股票价格之间有很好的匹配，从而反映了股票价格预测的最小误差率该预测基于Maruti数据集。如图所示。图8中，水平轴提供时间轴，而垂直轴示出股票价格。实际股票价格与预测股票价格之间存在密切的匹配关系，从而反映出-在股票价格的预测中，使误差率最小该预测基于塔塔钢铁数据集。如图所示。在图9中，水平轴提供时间轴，而垂直轴示出股票价格。实际股票价格与预测股票价格之间有很好的匹配，从而反映了股票价格预测的最小误差率该预测基于TCS数据集。如图10所示，水平轴提供了时间轴，而垂直轴示出了股票价格。实际股票价格与预测股票价格之间存在密切的匹配，从而反映了股票价格预测的最小误差率预测基于Wipro数据集。S.R. Polamuri，D.K. Srinivas，D.A. KrishnaMohan沙特国王大学学报7441表2MMHPA、GANHPA和MMGANHPA三种混合预测模型的性能比较。证券报价机MM-HPAGAN-HPAMMGAN-HPAMaeMSE相关性MaeMSE相关性MaeMSE相关性TCS0.002634000.000034900.995742000.002633970.000034900.995866470.002633440.000034900.995985974BHEL0.002671000.000022900.996741000.002670970.000022900.996865590.002670440.000022900.996985214Wipro0.002397000.000024000.997037000.002396970.000024000.997161630.002396490.000024000.997281289AXISBANK0.002804000.000030200.998247000.002803960.000030200.998371780.002803400.000030200.998491585马鲁蒂0.002218000.000021600.997091000.002217970.000021600.997215640.002217530.000021600.997335306塔塔斯泰尔0.004635000.000067700.997238000.004634940.000067700.997362650.004634010.000067700.997482334见图12。在MAE方面的性能比较。图十三.在MSE方面的性能比较。5.2. MMGAN-HPA的结果本节提供了股票价格预测和MAE，MSE和相关性等性能指标的实验结果如图11所示，提供了所有股票报价机的预测结果。结果表明，与GAN-HPA相比，MMGAN-HPA的预测精度有了进一步的提高。第5.3中给出的结果比较结果表明这一点。S.R. Polamuri，D.K. Srinivas，D.A. KrishnaMohan沙特国王大学学报7442见图14。相关性方面的性能比较图15. 混合预测模型的性能比较。5.3. 性能比较本节评估本文定义的两种预测算法GAN-HPA和MMGAN-HPA的性能。并对两种算法的性能进行了比较利用MM-PHA，另一种用于股票价格预测的混合算法，在（Pang等人， 2020年）。将所提出的混合预测模型GAN-HPA的预测性能与最新的混合预测模型MM-HPA进行了比较这两种模式都是基于深度S.R. Polamuri，D.K. Srinivas，D.A. KrishnaMohan沙特国王大学学报7443学习主要区别在于前者基于GAN架构，而后者基于线性和非线性预测模型的组合。表2显示了MAE、MSE和相关性方面的性能差异，并比较了所有三种混合预测模型。如图1和图2所示，在图12 -14中，股票报价机被提供在水平轴中，并且关于MAE、MSE和相关性的误差率分别被提供在垂直轴中。不同的MAE和MSE由股票报价机显示。以同样的方式，不同的相关性值观察到不同的股票报价。然而，GAN-HPA表现出比其前身MM-HPA相对更好的性能。虽然两者都是混合预测模型，但基于Stock-GAN框架的混合预测模型GAN-HPA具有生成器和神经网络（LSTM-CNN）结合超参数调整的优点。因此，它的预测性能优于MM-HPA。表2中给出的数据以及图15中进一步可视化的数据表明，当MM-HPA和GAN-HPA组合形成另一种称为MMGAN-HPA的混合模型时，性能有所改善。提出了混合深度学习模型，并发现其效率更高。线性和非线性模型相结合以获得更好的预测性能。现有的深度学习模型中有许多见解，导致了本文中进行的研究。首先，CNN更适合分类。其次，LSTM可以比RNN更好地捕捉时间数据变化第三，深度学习模型缺乏预处理（或数据质量），除非有一个有效的基于NLP的特征选择方法。第四，GAN被发现在使用无监督方法学习数据的内部表示方面是有效的，除了生成类似于真实数据的新数据之外。第五，线性和非线性模型的混合可以提供更好的股票预测性能。第六，需要一个基于GAN的框架，利用CNN，LSTM和新颖的预处理来改善现有技术。考虑到这些观察结果，MMGAN-HPA具有更好的性能。6. 结论和今后的工作本文提出了一种基于GAN的股票价格预测框架Stock-GAN。LSTM和CNN被用作生成器和递归模型。GAN从新的预处理方法中获得选定的特征。GAN的结果经过强化学习和贝叶斯优化，以调整Stock-GAN中两个模型的超参数。线性模型如ARIMA用于股票近似。自动编码器用于从数据中提取特征。XGBoost用于了解特征的重要性，以便过滤掉对预测目标函数没有贡献的特征。提出了一种基于生成对抗网络的混合预测算法。使用自然语言处理（NLP），自组织映射（SOM），ARIMA，特征组合和傅立叶变换从数据集进行特征提取在堆叠自动编码器的帮助下对特征进行进一步的去噪。利用主成分分析（PCA）和XGB进行特征重要性预测和降维.使用Apache MXNet API和Python数据科学平台来实现Stock-GAN。之后，MM-HPA和GAN-HPA结合形成了另一种称为MMGAN-HPA的混合模型。实证研究表明，股票-GAN实现了良好的业绩在股票价格预测时，与最先进的股票方面价格预测、MAE、MSE和相关系数。本文提出的GAN-HPA算法在股票价格预测方面优于已有的MM-HPA模型。但MMGAN-HPA显示，GAN-HPA的改进。未来，我们打算进一步增强Stock-GAN，以处理多样化的股票数据。未来工作的另一个方向是探索股票市场数据中潜在的因果关系。竞争利益作者声明，他们没有已知的竞争性财务利益或个人关系，可能会影响本文报告的工作。引用秋田河 Yoshihara ， A. ，松原， T. ， Uehara ， K. ， 2016. 1XPHULFDO DQG7H[WXDO，QIRCULAR WLRQ：使用数值和文本信息进行股票预测的深度学习。IEEE，8-13.M.阿萨德：使用集成学习优化股票市场预测。第九届国际会议应用信息通讯AICT 2015 -Proc.263 -268（2015）。10.1109/ ICAICT.2015.7338559。Bukhari，A.H.，拉贾，M.A.Z.，Sulaiman，M.，Islam，S.，Shoaib，M.，Kumam，P.，2020.分数神经序列ARFIMA-LSTM用于金融市场预测IEEE Access. 8，71326-71338。https://doi.org/10.1109/Access.628763910.1109/ACCESS.2020.2985763.Chen，L.，中国地质大学，乔，Z.，王，M.，Wang，C.，中国地质大学，Du，R.，斯坦利阁下，2018.哪种人工智能算法能更好地预测中国股市？IEEE Access. 6，48625-48633。https://doi.org/10.1109/ACCESS.2018.2859809网站。陈昆，张伟，卢，尤，2020.使用集成注意力机制、多层感知器和双向长短期记忆神经网络的混合深度学习模型预测股票价格。 IEEE Access.8 ， 117365https://doi.org/10.1109/Access.628763910.1109/ACCESS.2020.3004284.Eapen，J.，Bein，D.，Verma，A.：基于CNN和双向LSTM的新型深度学习模型，用于改进股票市场指数预测。2019 IEEE第九届年会Comput. Commun.工作CCWC 2019年会。264-270（2019）。10.1109/ CCWC.2019.8666592。Hiransha，M.，Gopalakrishnan，E.A.，Menon，V.K.，Soman，K.P.，2018.使用深度学习模型进行 NSE 股票市场预测。 Procedia 计算 Sci. 132 ， 1351-1362 。https://doi.org/10.1016/j.procs.2018.05.050网站。Hoseinzade，E.，Haratizadeh，S.，2019. CNNpred：基于CNN的股票市场预测，使用不同的变量集。专家系统应用129，273-285。https://doi.org/10.1016/j.eswa.2019.03.029.Katayama，D.，基诺，Y.，Tsuda，K.，2019.一种基于深度学习的财经新闻情感极性识别方法。Procedia计算Sci.159，1287-1294。https://doi.org/10.1016/j.procs.2019.09.298网站。李，J.，Kim，R.，科，Y.，康，J.，2019年。基于股票图表图像的深度q网络全球股市预测IEEEAccess.7，167260-167277。网址：http：//doi.org/10.1109/Access.628763910.1109/ACCESS.2019.2953

下载后可阅读完整内容，剩余1页未读，立即下载