没有合适的资源?快使用搜索试试~ 我知道了~
沙特国王大学学报基于聚类的改进CSA优化ELM融合Sudeepa DasSahu,Tirath Prasad Sahu,Rekh Ram Janghel印度恰蒂斯加尔邦赖布尔国家技术学院信息技术系阿提奇莱因福奥文章历史记录:收到2021年2021年9月23日修订2021年10月15日接受2021年10月21日在线提供保留字:乌鸦搜索算法极限学习机分解方法股市基于聚类的改进乌鸦搜索算法A B S T R A C T股票价格预测是一项重要的指标,它可以提高金融调查人员和投资者的决策能力,从而以最小的风险获得最大的收益。然而,由于股票价格的不确定性、不连续性和随机非线性等特点,股票价格的短期预测是一个复杂的问题。本文提出了一种基于内在时间尺度分解(ITD)、基于聚类的改进乌鸦搜索算法(CMCSA)和优化极限学习机(OELM)的随机非线性股票市场价格预测模型。采用ITD方法将非平稳的股票价格数据分解为一些固有旋转分量和一个残差分量。ITD是将非平稳的股票价格数据转换为平稳的数据进行分析的一种方法。CMCSA是对Crow搜索算法(CSA)的改进,使其具有更好的选择ELM最优权值和最优偏置的能力。最后,利用优化后的ELM分别预测PRCs和残差成分,并结合PRCs和残差成分预测短期股票的收盘价。通过求解基准问题,验证了CMCSA的有效性.实验结果表明,ITD-CMCSA-OELM模型的性能优于CMCSA-OELM、CSA-OELM、DE-OELM(Differential Evolution Optimized ELM)和ANN模型。版权所有©2021作者。由爱思唯尔公司出版代表沙特国王大学这是一个开放的访问CC BY-NC-ND许可证下的文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。1. 介绍预测是利用历史数据对未来有利的情景进行预测的过程.股票市场价格预测由于其不确定性、不连续性和随机非线性等特点而被认为是最具挑战性的研究课题。失业率、政治事件、石油和黄金价格、工业产出、零售额和总体经济状况等影响因素使得SM价格预测更加困难。其主要目的是利用较少的数据和现实的股票市场模型,获得更成功和准确的SM预测。基本面分析和技术面分析是时间序列SM预测的两种重要方法。宏观经济因素包括在基本面分析中,而历史时间序列数据包括在技术分析中。*通讯作者。电 子 邮 件 地 址 : gmail.com ( S.Das ) , tpsahu.it @ nitrr.ac.inexample.com(T.P.Sahu),wwwnitrr.ac.in rrjanghel.it @(R.R.Janghel)。沙特国王大学负责同行审查cal分析技术分析由于其简单的建模结构和人工智能(AI)的广泛应用领域而在研究人员中更受欢迎(Schabacker,2005)。证券市场收盘价的预测对于投资者获取更大的收益至关重要。自回归综合移动平均(ARIMA)模型用于阐明时间序列数据并预测该序列的未来(Box等人,2015年)。然而,它不足以预测SM价格,其中活动主要基于一些宏观经济因素(O 'Hara和Oldfield,1986年; Bilson等人,2001年)。因此,大多数研究人员提出了基于机器学习的股票市场预测模型,并对相关工作进行了简要讨论(Henriqueet al.,2019年;Kumar等人,2021年)。在这项工作中,一个新的基于聚类的改进CSA技术(CMCSA),探索ELM的参数。用CSA和CMCSA算法优化ELM模型的权值和偏差,对三种不同股票进行预测。将CMCSA-OELM与ITD等分解方法相融合,提高了股票价格预测的准确性。通过与CMCSA-OELM、CSA-OELM、DE-OELM、ELM和ANN技术的比较,验证了该方法的性能。本文的贡献如下:https://doi.org/10.1016/j.jksuci.2021.10.0041319-1578/©2021作者。由爱思唯尔公司出版代表沙特国王大学这是一个在CC BY-NC-ND许可证下的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。制作和主办:Elsevier可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页:www.sciencedirect.comS. Das、Tirath Prasad Sahu和Rekh Ram Janghel沙特国王大学学报8778Bb/1Bi. 提出了一种新的基于簇的改进CSA(CMCSA),它具有平衡探测和利用的能力所提出的CMCSA技术的性能通过解决CEC2008基准问题(Tang等人, 2007年)。ii. CSA和建议CMCSA技术被用来改善ELM的性能,通过选择最佳的权重和偏置的ELM模型。iii. ITD方法用于将股票价格数据分解为PRCs和残差分量,然后使用CMCSA-OELM单独预测,该模型称为ITD-CMCSA-OELM模型。iv. 通过误差测量和Friedman检验,比较了该模型与CMCSA-OELM、CSA-OELM、DE-OELM、ELM和ANN模型对论文的其余部分组织如下:第2考虑与相关工作的比较;第3节讨论研究数据和方法(OELM、ITD和CMCSA);第4节讨论验证预测模型的误差测量;第5节说明拟议模型的验证和结果;第6提供结论。2. 相关工作2.1. 神经网络预测模型一些研究人员建议,根据神经网络(NN)家族的技术来提高SM预测的准确性。为了预测SM,采用了基于人工神经网络(ANN)的模型(Moghlovel等人,2016; Qiu等人,2016; Kara等人,2011; Guresen等人,2011年),由于这些令人称道的好处,如有机学习、非线性数据处理、容错和自检修。通过使用NN家族的一些学习算法,例如前馈神经网络(FFNN)(Gupta和Wang,2010)、多层感知器(MLP)(Devadoss和Ligori,2013;Hiransha等人,2018)、反向传播神经网络 ( BPNN ) ( Wang et al. , 2011 ) 和 卷 积 神 经 网 络 ( CNN )(Gunduz等人,2017年)。所有这些都是基于梯度的算法,具有某些约束,例如训练的高计算时间和陷入问题局部最优的概率。 ANN的复杂性被支持向量机(SVM)克服以预测时间序列数据(Cortes和Vapnik,1995;Sansom等人,2003年)。Huang等人(2006)推荐了一种被称为ELM的单隐层前馈神经网络(SLFNN)。ELM的神经元数目、激活函数和输出权值在应用过程中不需要调节。ELM的这些特性强化了快速学习率的性能。Huang等人(2011)在许多领域实现了ELM回归和分类。从过去的几十年来,ELM在SM预测领域中显著地确定了优于传统技术的优势(Li等人,2016; Sun等人, 2014年)。2.2. 基于混合分解方法的预测模型将机器学习技术与小波变换(WT)、经验模式分解(EMD)等数据分解方法相结合,作为混合学习技术,对非平稳时间序列数据进行预测,提高预测精度。小波变换与自适应神经模糊推理系统(ANFIS)和递归神经网络(RNN)的集成,用于预测股票市场价格的方法(Hsieh et al.,2019;Hsieh et al.,2011年)。 EMD与ANN和基于因子分解机的神经网络(FNN)的融 合 用 于 预 测 时 间 序 列 数 据 ( 股 票 市 场 价 格 和 电 力 负 荷 )(Lahmiri,2020;Zhou等人,2019年)的报告。Cao等人(2019年)提出了与LSTM集成的具有自适应噪声的完全包围经验模式分解(CEEMDAN)来预测金融时间序列。2.3. 基于混合优化技术的神经网络预测模型一些研究人员认为,优化技术和机器学习技术的结合提高了SM预测的准确性。为了用基于模糊的增强准确性遗传算法(GA)来预测SM价格、回报和趋势(Hadavandi等人,2010)、SVM(Choudhry和Garg,2008)、ANN(Perwej和Perwej,2012)和概率权重支持向量机(PWSVM)(Zhang等人,2016年:全面实施。稍后,基于粒子群优化(PSO)的最小二乘支持向量机(LS-SVM)(Hegazy等人,2014)、基于差分进化(DE)的计算高效功能链接人工神经网络(CEFLANN)(Rout等人, 2014)、基于化学反应优化(CRO)的MLP(Nayak等人,2018)和基于人工鱼群算法(AFSA)的径向基函数神经网络(RBFNN)(Shen et al.,2011年)用于预测SM价格具有更好的准确性。人工蜂群-差分进化杂交(Hybrid ABC-DE)用于优化前馈神经网络(FFNN)的权重,以预测外汇汇率(Worasucheep,2015)。文献提供了足够的证据来证明混合学习算法的有效性,而不是传统的技术。3. 研究数据和方法3.1. 研究数据在这项工作中,三个不同的软件为基础的公司,如Wipro,Infosys和技术Mahindra被认为是有助于信息技术服务。每天(不包括节假日)的价格,三个股票被认为是这项工作,如图所示。1.一、考虑了2016年1月1日至2020年12月1日三只股票的价格数据训练数据集为2016年1月1日至2019年12月31日(982次观察),测试数据集为2020年1月1日价格数据包含所有股票的开盘价、最高价、最低价和收盘价。将开盘价、最低价、最高价和收盘价的归一化数据作为OELM的输入,OELM在等式(1)中表征。Xx- xmin1x最大-x最小实际的收盘价是通过对OELM的输出进行反归一化来确定的,如公式Eq. (二)、X¼Xωxmax-xminxmin2其中,X、xmax和xmin分别为归一化数据、最大值和最小值3.2. 极限学习机(ELM)Huang等人(2006)已经引入了名为ELM的SLFNN。输入层、隐藏层和输出层是ELM的基本部分。隐层神经元在训练过程中不需要优化S. Das、Tirath Prasad Sahu和Rekh Ram Janghel沙特国王大学学报8779X¼64......2375ðÞ67图1.一、数据集的图形版本,(a)Wipro,(b)Infosys,(c)Tech Mahindra。期这些神经元是任意分布的,从不间断.输入被链接到隐藏层与随机固定的权重(Wi)和偏差(Bj)的时间复杂性和计算复杂性可以破坏相比,人工神经网络和BPNN。ELM的结构如图所示。 二、ELM具有比BPNN快一千倍的巨大收敛性(Huang等人, 2006年)。非梯度ELM不仅具有比梯度ELM更好的推广性能,而且避免了局部极小值、错误学习率和过拟合在等式(3)中示出了针对训练集R^f^Xi;ti^g;i^l;2;:;n的具有L个隐藏节点的ELM的输出函数。LfbjHXtj3第1页其中,b=b1,b2,.. . ,bL是隐藏层和输出层之间的权重矩阵,并且t =t1,t2,. . ,tL是训练数据的目标矩阵。隐层的输出由等式(4)估计。G=w1;b1;X 1· · ·GwL;bL;X 1HG=w1;b1;X2·· ·Gw L;b L; X24Gw1;b1;Xn·· ·GwL;bL;Xn图二. ELM的结构S. Das、Tirath Prasad Sahu和Rekh Ram Janghel沙特国王大学学报8780f¼···gXði;i;iXk1-Xkb¼。HTH-1HT‘激活函数采用Sigmoidal、Gaussian、Hard极限和Fourier级数函数。在这项工作中,采用S形函数作为激活函数,如等式2所示(五)、G w b X151e-wxbELM的期望输出通过使用等式(1)来确定(六)、XT¼L XT1-LXT¼LTHT其中,LT¼LXT(基线信号)HT1/2-LLXT(PRC)X T的局部极值可通过让步dk;k 1; 2;并且为了方便起见将d0通过考虑相邻信号的不稳定性,使得X-T在一定区间内具有常值,在该区间内可能存在极值dk是区间的右端点。假设L T和H T是在½0;dk]上确定的,并且XT对于½0;dk<$2]是可行的。基线信号定义在连续两次测量之间的间隔1/2dk;dk1]内T试验<$Hb<$6Ω在这项工作中,开放,高和低被认为是输入到ELM和SM的收盘价被认为是ELM的目标矩阵。3.3. 优化的ELM在Eqs.(8)和(9)。L T¼L K. Lk1-LkXT-Xkt2dk;dk18其中,Lk<$$>Ldk和Xk<$XdkLk1¼aXk。dk1-dkXk2-Xk1-aXk1a20;1Huang等人(2006)提出的SLFNN(ELM)被广泛采用。用于分类和回归目的,性能更好dk2-dkþð9Þ和精度。ELM的有效性直接依赖于相关的输入权值和偏置,通过合理选择ELM的参数(权值和偏置)可以改善输入权值和偏置。可以采用具有有效解决非线性和高维问题能力的元启发式技术。为此,CSA和CMCSA算法被单独执行,以减少预测误差,通过完美地选择相关的参数(权重和偏差)的ELM,以减少误差。OELM的工作流程如图所示。3 .第三章。3.4. 内在时间尺度分解内在时间尺度分解(ITD)是一种数据分解方法,它是一种自适应和数据驱动的方法(Frei和Osorio,2007)。ITD通常用于将非线性复杂信号分解为适当旋转分量(PRCs)和残差信号。ITD是优选的,其优点在于通过实现由信号本身的频率评估的时间信息来反平衡时间和频率信息之间的折衷ITD分解是基函数自由的。ITD采用线性变换代替迭代包络提取方法,将信号分解为若干个伪随机分量。为此,ITD的性能是高效和快速的。原始非线性信号(X-T)可以如等式(1)中所描述的那样被分解。(七)、一般取a为1/2。在评估基线信号之后,从原始信号引出PRC。分解后的伪随机数在频率范围内由高到低,呈单调变化趋势。其结果是,原始信号被分解成几个PRC,其频率范围从高到低和单音趋势。nX T¼Hm;Trt10m¼1其中,Hm;T是第m个PRC,r(t)是趋势。在这项工作中,股票价格数据(开放,高,低和收盘)被分解为PRC和残留信号。3.5. Crow搜索算法乌鸦被提名为最聪明的鸟。与它们的身体结构相比,乌鸦的根据大脑与身体的比例,它们的大脑比人类略小。乌鸦把它们过剩的食物藏在毫无疑问的地方,当需要的时候,它们会把食物拿回来。对乌鸦来说,为下一季寻找食物是一项非常复杂的任务,因为一些敌人乌鸦也会来跟踪食物。乌鸦图三. 优化的ELM结构(OELM)。S. Das、Tirath Prasad Sahu和Rekh Ram Janghel沙特国王大学学报8781我DD- f XMMMDD我老.fX我最>X≥¼67Þ. - 是 的 Σ10DNc F.Xi@F.X最好的广告i¼1Wi我X新¼我2223我我我我试图通过改变搜索空间的方向来欺骗敌方乌鸦。这里选择乌鸦作为路径查找器或搜索器,并且选择乌鸦在搜索空间中的每个位置作为最优点。乌鸦通过监视和跟踪其他鸟类来偷取它们不起眼的食物。为了避免成为下一个容易的目标,乌鸦采取了一些额外的预防措施,比如改变不起眼的地方。通过考虑这些天才的行为,CSA受到乌鸦社会行为的启发(Askarzadeh,2016)。像其他的Meta-启发式技术,组的乌鸦被随机初始化(十三)、可以通过让步具有最差适应度函数的Mj来更新Xi。通过这种方法,解可能偏离最优解。在这幅作品中,整群乌鸦被分成了几个小组。可以通过考虑等效组的最适合的乌鸦来选择领导者,并且该组的跟随者乌鸦通过让步领导者乌鸦来更新,如等式(15)所示。X¼X你好x-x的 (c)如果r1≥APk<$1;2;· ··;n giki通过考虑方程(11)中描述的问题的维数(D)和乌鸦的数量(NC)。新老我老了ð15Þ1121乌鸦61·· ·X12·· ·X27....其中,ng是组的数目。通过考虑重量(W),乌鸦在组之间分配,如等式11(16)(Atashpaz-Gargari和Lucas,2007年)。4XNC1XNC2· ··XNC5¼exp-DPf Xi最好ð16Þ开始了所以,他们在最初的位置掩盖了他们的食物。乌鸦确定权重(W)以重新排列乌鸦。W的范围在0和1之间。对于具有最佳适应度的乌鸦,W值为1,对于具有最差适应度值的乌鸦,W值为0通过让步乌鸦的重量和追随者分布在111222612·· · M1·· ·M27.组等式(17)和(18)表示一组乌鸦数量的数学内存1/4。六、. ... .M2CCDð12ÞiWG4MNNMN5a¼Png Gð17Þ在其他乌鸦的配合下,乌鸦们更新了它们的日NG 四分之一回合。ai×Nf18检查其他乌鸦(jth)。第j只乌鸦试图欺骗第i只乌鸦乌鸦通过改变食物在搜索空间中的位置,意识到被敌人乌鸦跟踪。在等式(13)中,描绘了乌鸦的位置变化的数学解释。其中,WG、NG和Nf分别是群的领导者的权重、群中乌鸦的数量和跟随者乌鸦的数量。通过这一过程,提高了算法的开发能力。在状态-2(具有感知概率)中,第i只乌鸦(Xi)由随机生成的crow恢复,如i(Xi我是你的朋友。Mj-Xi≥AP等式(13),当Xj知道其跟随者crowXi时,即,R Xir×Xm-X老我当且仅当<$Xa<$f<$Xb<$<3.6. 基于计算机的改进CSA(CMCSA)新¼i:r×-X,你好XmX
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Aspose资源包:转PDF无水印学习工具
- Go语言控制台输入输出操作教程
- 红外遥控报警器原理及应用详解下载
- 控制卷筒纸侧面位置的先进装置技术解析
- 易语言加解密例程源码详解与实践
- SpringMVC客户管理系统:Hibernate与Bootstrap集成实践
- 深入理解JavaScript Set与WeakSet的使用
- 深入解析接收存储及发送装置的广播技术方法
- zyString模块1.0源码公开-易语言编程利器
- Android记分板UI设计:SimpleScoreboard的简洁与高效
- 量子网格列设置存储组件:开源解决方案
- 全面技术源码合集:CcVita Php Check v1.1
- 中军创易语言抢购软件:付款功能解析
- Python手动实现图像滤波教程
- MATLAB源代码实现基于DFT的量子传输分析
- 开源程序Hukoch.exe:简化食谱管理与导入功能
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功