没有合适的资源?快使用搜索试试~ 我知道了~
=≥软件X 22(2023)101353原始软件出版物NonParRolCor:一个用于估计两个规则时间序列Josué M.Polanco-Martíneza,b,José L.洛佩斯-马丁内斯caGECOS-IME,萨拉曼卡大学,西班牙b巴斯克气候变化中心(BC3),西班牙莱奥阿c墨西哥尤卡坦州梅里达尤卡坦自治大学数学系。ar t i cl e i nf o文章历史记录:2022年12月31日收到2023年2月8日收到修订版,2023年保留字:热图Monte-Carlo模拟多重检验问题非参数检验滚动窗口相关a b st ra ctR包NonParRolCor估计两个常规时间序列之间的滚动窗口相关性。滚动相关系数估计的统计显著性解决了多重检验的影响。这是通过Monte Carlo模拟来完成的,通过置换其中一个变量并保持另一个变量不变。NonParRolCor使用并行计算来改进估计统计显著性时的计算时间。NonParRolCor包含四个函数,用于估计和绘制单个窗口长度或窗口长度带的相关系数。NonParRolCor一些应用程序来说明它的使用。版权所有2023作者。由爱思唯尔公司出版这是CC BY-NC-ND下的开放获取文章许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)。代码元数据当前代码版本v0.80用于此代码版本的代码/存储库的永久链接https://github.com/ElsevierSoftwareX/SOFTX-D-22-00402代码海洋计算胶囊不可用法律代码许可证GPL(>2)许可证使用的代码版本控制系统软件代码语言、工具和服务使用R编译要求,操作环境服务使用R(3.6),gtools,pracma,colorspace,doParallel如果可用,链接到开发人员文档/手册https://cran.r-project.org/web/packages/NonParRolCor/NonParRolCor.pdf支持问题电子邮件josue.m. gmail.com1. 动机和意义科学研究中最常见的任务之一是寻找两个或多个时间序列之间的关系。这主要是通过使用Pearson或Spearman估计量估计两个时间序列之间的相关系数来完成的[1,2]。然而,在整个研究期间估计的相关性作为关联的总体测量,尽管这是分析两个时间序列之间相关性的有用初始方法,但时间序列之间的关系可能随时间而变化[3,4]。*通讯作者:GECOS-IME,萨拉曼卡大学,萨拉曼卡,西班牙.电子邮件地址:josue. usal.es(Josué M. Polanco-Martínez)。https://doi.org/10.1016/j.softx.2023.101353此外,时间序列可能包含多个时间尺度上的信息,在许多情况下,这些序列及其之间的关系可能不是固定的[3,5应对这些挑战的一种简单而有力的方法是滚动、运行或滑动窗口相关。滚动窗口相关性也可用于评估相关性随时间的演变和稳定性然而,当估计滚动窗口相关性的统计学显著性时,多重检验的一个附带效应这通常也被称为多重检验或比较问题[8,9]。在文献中,很少有R软件包可用于估计滚动窗口相关性,更糟糕的是,这些软件包不包括统计显著性检验或不解决多重比较问题。据我们所知,2352-7110/©2023作者。由爱思唯尔公司出版。这是一篇开放获取的文章,使用CC BY-NC-ND许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表SoftwareX期刊主页:www.elsevier.com/locate/softxJosué M. Polanco-Martínez和José L. 洛佩斯-马丁内斯软件X 22(2023)1013532=有三个R包估计滚动相关性,但它们不估计滚动相关系数的统计显著性。它们是:(1)zoocat,其执行此任务的函数是rollcor()[10]-尽管此程序包已于2020年 10月从CRAN中删除;(2)roll,其也能够通过其函数roll_cor()[11]估计滚动相关性;以及(3)TTR,其包括用于估计滚动相关性的函数runCor()[12]。还有一个R包,其中包括滚动相关系数的统计显著性估计,但用于估计的检验显著性并没有解决同时重复多个显著性检验所产生的风险。这个R包名为dendroTools,使用daily_response()函数来估计滚动相关性[13]。据我们所知,只有两个R包可以解决多重比较问题:(1)RolWinMulCor,它使用经典的方法,即 , 校 正 p 值 以 解 决 多 重 比 较 问 题 [9]; 以 及 ( 2 )NonParRolCor[14],这是本软件论文中介绍的RR包NonParRolCor是基于以前的工作”[15]我曾在一次非正式会议上发言。滚动窗口相关性的统计显著性处理多重比较问题。这项先前的工作部分受到Telford(2013)[16]和Polanco-Martínez(2019)[4]的启发。NonParRolCor中使用的非参数检验基于蒙特卡罗模拟,通过置换分析中的一个变量(例如,因变量)并保持另一个变量(例如,自变量)固定。我们通过并行计算改进了这个测试,以减少计算时间:现在可以使用尽可能多的CPU内核。我们想强调的是,据我们所知,NonParRolCor是唯一一个使用“实验”(Monte Carlo)统计显著性检验来解决多重比较问题的R该测试还考虑了计算滚动相关的窗口长度。此外,NonParRolCor能够估计和绘制滚动窗口相关系数,只有一个单一的窗口长度和一个波段的窗口长度作为热图。滚动窗口相关系数也可以通过Pearson,Spearman和Kendall估计,也可以使用不同的统计显著性水平。本文介绍了NonParRolCor的主要特点和功能,并给出了一些实际时间序列的例子。NonParRolCor最初是为了分析环境时间序列而开发的,但该软件可以用于不同科学领域的时间序列(例如,经济、金融、能源、地质等)。NonParRolCor是免费的开源软件(GPL许可证),可在R项目的官方存储库TheComprehensive R Archive Network(CRAN)上获得本文的结构如下。第2节简要描述了非参数检验,第3节详细描述了NonPar- RolCor第4节提供了一些应用程序。第5节阐述了软件的影响,并总结了本文2. 估计统计显著性NonParRolCor包括用于估计滚动窗口相关系数的统计显著性的非参数检验,其考虑了同时重复多个显著性检验。该检验基于MonteCarlo模拟,通过置换分析中的一个变量(例如,从属变量)并保持另一个变量(例如,独立变量)固定。它计算滚动的临界值每个窗口长度的相关系数,使得每个窗口长度的相关系数能够与其相应的临界值[9,16]。这个测试的描述是基于以前的工作[15],所以在这里我们只提供一个简短的描述。1. 输入:一个独立变量(例如,X)和一个因变量(例如Y)与N个元素。2. 对于每个可能的窗长或窗宽(窗长范围从奇/偶窗长的3/4到最大窗长,即N或N-1取决于N是奇数还是偶数),进行Monte-Carlo模拟以确定其相应的CRITVAL,即:(a) 开始蒙特卡罗模 拟以确定零分布:对于 i1 到MCsims重复(建议至少使用1000次):i. 置换依赖变量的所有时间段ii. 估计独立变量和置换相依变量之间滚动窗口相关系数(通过Pearson、Spearman或Kendall估计(b) 关闭Monte-Carlo模拟循环。(c) 估计临界值在集合(步骤(a))中获得的MCsims3. 输出:确定每个窗口长度的相关系数的统计显著性,如果abs(相关系数)>CRITVAL取值范围为0到1,并取决于所分析的时间序列中的元素数量以及检查窗口长度[15,16]。较小的窗口长度产生接近于1的CRITVAL,而较大的窗口长度产生趋于零的CRITVAL。3. 软件描述在以下小节中,我们提供了非ParRolCor系统架构的详细信息(第3.1节),并概述了软件功能(第3.3节)。3.1. 软件构架NonParRolCor在两个独立的实体中包含四个函数。两个函数用于估计,另外两个用于绘图,如图1中所示。有两个函数用于绘图,但也可以通过其他内部或外部R图形函数绘制估计函数由于NonParRolCor R软件包在The Comprehensive R ArchiveNetwork ( CRAN ) 上 可 用 , 因 此 可 以 通 过 执行>install.packages(''NonParRolCor'')从R 源代码也可以在CRAN上找到。NonParRolCor可以在主要操作系统(Windows,GNU/Linux和MacOS)中安装和使用,因为R是多平台的。Josué M. Polanco-Martínez和José L. 洛佩斯-马丁内斯软件X 22(2023)1013533Fig. 1. NonParRolCor的软件架构。给定两个常规时间序列,NonParRolCor估计滚动窗口相关系数及其统计显著性,解决多重比较问题。 NonParRolCor还使估 计函 数 的输出可视化。图二. 通过Pearson(左)和Spearman(右)显示rolcor_estim_1win和plot_rolcor_estim_1win函数输出的视觉特征。具有统计学显著性(95%置信水平)的相关系数以黑点表示X和Y是合成数据中包含的两个AR1时间序列[14]。 .3.1.1. 估计我们提供了两个用于估计的函数的语法1. rolcor_estim_1win:估计两个常规时间序列的单个窗口长度的滚动相关系数及其统计显著性。其语法如下:rolcor_estim_1win(输入数据,CorMethod=“pear-son”,widthwin=3,Align=“center”,rmltrd=TRUE,Scale=TRUE,MCSim=1000,Np=2,prob=0.95)2. rolcor_estim_heatmap:这将滚动相关系数估计为函数rolcor_estim_ 1win,但该估计是针对窗口长度带或所有可能的窗口长度执行的,从三到四。分析中的时间序列中的元素数量(即dim(inputdata)[5])。此函数具有以下语法:rolcor_estim_heatmap(inputdata,CorMethod=“pearson“,typewidthwin=“FULL“ ,widthwin_1=3,widthwin_N=dim(inputdata)[1],Align=“center”,rmltrd=真,比例=真,MCSim=1000,Np=2,概率=0.95)参数描述如下:inputdata:一个三列的矩阵,其中第一列必须是时间,第二列(“independent”)和第三列( “dependent” )必须是所研究的时间序列。CorMethod:估计相关性的默认方法是“pearson”,但也可以使用“spearman "和”kendall“。Widthwin:当估计滚动窗口相关系数时使用的窗口长度或窗口大小。它可以取从3到所研究的时间序列中的元素数的值。对齐:用于对齐滚动对象。有三个选项:····Josué M. Polanco-Martínez和José L. 洛佩斯-马丁内斯软件X 22(2023)1013534=====左,右,然而,这意味着窗口长度必须是奇数。typewidthwin : 该 参 数 具 有 两 种 模 态 : ( 1 )typewidthwin=“PARTIAL”,用于估计窗口长度带(从widthwin_1到widthwin_N)的滚动相关性;以及(2)typewidthwin =“FULL”,用于估计所有可能的窗口长度(从3到dim(inputdata)[ 5 ])的滚动相关性。rmltrd:用于删除inputdata中包含的线性趋势。Scale:用于对分析中的变量进行标准化或非标准化(默认选项为“TRUE”;否则为“TRUE”)。MCSim:Monte-Carlo模拟的数量。建议使用至少1000个重复。NP:CPU核心数。不建议使用计算机的最大核数(默认情况下Np设置为两个核)。概率:这定义了统计显著性的水平(使用的典型值是概率0.95,但也可以使用其他值)。rolcor_estim_1win的输出是一个包含六个元素的列表:➜ Correlation_coefficients:这个元素是一个数组,包含时间(默认情况下,Align '' center ''是中心时间)和滚动窗口相关系数。➜ CRITVAL:包含用于确定滚动窗口相关系数统计显著性的临界值➜ CorMethod:这是用于估计滚动相关性的相关性方法(估计器)(例如,➜ Widthwin: 这 元件包含的窗口长度。➜ left_win和righ_win:这两个辅助元素用于适应滚动窗口相关系数的时间rolcor_estim_heatmap的输出是一个包含八个元素的列表:➜ matcor:这个元素包含一个带有滚动窗口相关系数的数组。➜ CRITVAL:这是一个包含窗口长度临界值的数组➜ NoWindows:这是窗口的数量➜ 窗口:这个元素包含窗口长度.➜ left_win和righ_win:这两个辅助元素如上所述。➜ MCSim和prob:这两个元素也如上所定义。3.1.2. 绘图以下是用于绘图的两个函数的语法描述1. plot_rolcor_estim_1win:这将rolcor_estim_1win函数的输出绘制为单个图,指示具有统计显著性的相关系数。该函数还绘制所研究的时间序列语法如下:plot_rolcor_estim_1win(inputdata,corcoefs,CRITVAL,widthwin,left_win,righ_win,varX=“X“,varY=“Y“,coltsX=“black“,coltsY=“blue“,rmltrd=TRUE,Scale=TRUE)2. plot_rolcor_estim_heatmap:这将rolcor_estim_heatmap函数的输出绘制为热图,并且仅绘制统计上显著的那些系数,即,不显著的系数留空。该函数还绘制分析数据 此函数具有以下语法:plot_rolcor_estim_heatmap(inputdata,c o r c o e f s ,CRITVAL,Rwidthwin=“",typewidewin=“”,widthwin_1=3,widthwin_N=dim(输入数据)[1],varX=“X“,varY=“Y“,coltsX=“black“,coltsY=“blue”)我们只定义尚未描述的参数。varX和varY:这些参数用于定义所研究的时间序列的名称,例如,X表示第一个序列,Y表示第二个序列。coltsX和coltsY:这两个参数用于定义所研究的时间序列图的颜色。还有其他参数(例如HeigWin 1、HeigWin 2、col- COEF、CEXLAB、LWDtsX等)这有助于个性化研究中的系列图和滚动相关系 数, 但我们不在 这里描述它 们, 因为它们对 于使用NonParRolCor不是必不可少的。然而,它们在NonParRolCor的文档中进行了描述[14]。3.2. 辅助数据集NonParRolCor包含三个辅助数据集:(1)syn-theticdata,包含三列:第一列是“时间”(从1到500),第二列(命名为X)和第三列(命名为Y)由具有类似自相关性(ρ 0.25)的二元AR 1(1阶自回归过程)过程生成,前250个元素具有正相关性(r 0.85),最后250个元素具有负相关性(r -0.85),尽管整个时间间隔的相关性为零[ 15 ];(2)ecodata,包含四列:第一列是年份,显示时间(从1989年到2008年,每月分辨率),第二列(SST)包含大加那利岛以南( 28.5 N/16.5 W )1 的 海面 温度 (SST ) 的月 异 常, 第三 列(NAO)显示北大西洋涛动(NAO)2的月指数,最后一列(CPUE)给出大加那利岛西南部手工渔业的普通章鱼的月渔获量(以CPUE或单位努力渔获量衡量)[17];(3) ecodata2,它有三列:第一列显示时间(从1700年到1936年),第二列和第三列显示重建的太阳总辐照度(TSI)[18]和重建的大西洋蓝鳍金枪鱼(BFT)捕获量的第一主成分(PC1)[19,20]。3.3. 软件功能和示例这一部分包括两个小节:第一小节描述和说明了单个窗长的滚动窗相关估计的主要特征,第二小节描述和说明了一个窗长带的滚动窗相关估计的主要特征。1 SST数据可从www.example.com检索https://psl.noaa.gov/data/gridded/data.noaa。oisst.v2.html2 NOA数据可从www.example.com检索https://psl.noaa.gov/data/correlation/nao。数据········Josué M. Polanco-Martínez和José L. 洛佩斯-马丁内斯软件X 22(2023)1013535清单1:用于生成Fig. 二、> library(“NonParRolCor”)> XY_P<-rolcor_estim_1win(合成数据,CorMethod=“pearson“,widthwin=21,MCSim=1000,Np=6)> plot_rolcor_estim_1win(合成数据,corcoefs=XY_P$ Correlation_coefficients,CRITVAL=XY_P$ CRITVAL,widthwin= XY_P$ widthwin,left_win= XY_P$ left_win,righ_win=XY_P$ righ_win)清单2:用于生成Fig. 3.第三章。> XY_P<-rolcor_estim_heatmap(syntheticdata[150:350,],CorMethod=“pearson“,typewidthwin=“PARTIAL“,widthwin_1=11,widthwin_N=31,MCSim=1000,Np=6)> plot_rolcor_estim_heatmap(syntheticdata[150:350,],corcoefs= XY_P$ matcor,CRITVAL=XY_P$ CRITVAL,Rwidthwin=XY_P$Windows,typewidthwin=“PARTIAL“,widthwin_1=11,widthwin_N=31,varX=“X2“,varY=“Y2“,coltsX=“brown“,coltsY=“green“)3.3.1. 一个窗口长度NonParRolCor最重要的功能之一是它能够估计几个不同相关估计器的滚动相关。 图图2显示了使用合成数据集对Pearson和Spearman(两种最广泛使用的相关性估计方法)的21个元素的窗口长度估计的滚动相关系数之间的比较包含在NonParRolCor中。很明显,在时间250附近缺乏相关性,正如预期的那样。相关系数具有类似的值,但它们对于每个估计量大致不同,通过斯皮尔曼估计的系数比通过皮尔逊估计的系数略低。用于生成这些图的R代码在清单1中( 请 注 意 , 要 通 过 Spearman 生 成 滚 动 相 关 性 , 必 须 将 参 数CorMethod更改为3.3.2. 窗长带的滚动相关为了展示更多NonParRolCor的主要功能,我们使用函数rolcor_estim_heatmap 和 plot_rolcor_estim_heatmap 来 分析和绘制syntheticdata中包含的变量的子集(从150到350)[14]。从热图上可以看出(图)。3)用于轧制相关系数,有三个视觉功能,以帮助用户分析自己的数据时,NonParRolCor使用。也就是说,我们的R包使用户意识到:(1)对于最短窗口长度,特别是对于通过斯皮尔曼估计的热图相关性;(2)对于 所有窗口长度(从11到31);和(3)皮尔逊公式给出了比斯皮尔曼更好的估计,如第3.3.1节中建议的单个窗口长度。估计多个窗口长度的滚动相关性可能需要一点时间,具体取决于所使用的CPU内核的数量和速度。生成图所需的R代码。3在清单2中。4. 示例和与RolWilMulCor的作为示例,我们提供了两个包含工作R代码的片段。生成第一个说明性示例所需的第一个代码片段(清单3)(图1和图2)。4和5)显示了R指令用于估计和绘制总太阳辐射(TSI)[18]和重建的大西洋蓝鳍金枪鱼(BFT)渔获量[19,20]的窗口长度为11年和81年的PC1(主成分1)之间的滚动相关性。我们使用这些时间序列是因为在以前的研究中,我们发现这两个变量之间有很强的相关性[9,19]。选择这些窗口长度是因为众所周知,太阳辐照度在不同的时间尺度上变化,例如,每隔11年(Schwabe循环)或81年(Gleissberg循环),它是显示NonParRolCor特征的理想方法。图4(左)显示无统计学显著性对于11年窗口长度的任何相关系数,除了三个孤立的系数,但这些显著的相关系数可能是偶然发生的图 4(右)是在没有考虑多重比较问题的情况下产生的。如图所示,有几个相关系数的p值小于0.05,即这些系数具有统计学显著性。然而,必须认识到,这些滚动相关性并不能解决多重比较的问题,它们的重要性可能是偶然的,但我们的NonParRolCor R软件包能够为我们提供有关这个问题的信息。缺乏相关性可由两个因素的组合来解释:(1)分析数据的时间频率(每年);(2)这一窗口长度短(11个数据点)。另一方面,对于81年的窗口长度(图5左侧),存在相对高的相关性,这在统计上是显著的,其相关系数涵盖了大约从1775年到1840年的时间间隔。 我们已经排除了多重比较的潜在影响,因此这些解释更有可能代表所分析的两个变量之间的真实关联。图图5(右)显示了通过RolWilMulCor[14]估计的81年窗口长度的滚动相关性,但这些滚动相关性没有经过任何p值校正方法或我们的非参数检验。然而,除了几个重要的系数之外,结果实际上是相似的。这表明,从长期来看,金枪鱼捕获量的TSI和PC1之间可能存在这一结果得到了以前的研究[9,19],其中使用相同的时间序列,但不同的统计技术。第二个代码片段(清单4)用于创建图1。六、这个说明性的例子显示了函数的特性Josué M. Polanco-Martínez和José L. 洛佩斯-马丁内斯软件X 22(2023)1013536图3.第三章。通过Pearson(左)和Spearman(右)显示rolcor_estim_heatmap和plot_rolcor_estim_heatmap函数的输出的视觉特征。不具有统计学显著性(95%置信水平)的滚动相关系数为空白。线轮廓表示滚动相关系数的相似值X2和Y2是合成数据中包含的两个AR1时间序列的子集[14]。.清单3:用于生成示例1的代码(图1) 4).> XYP<-rolcor_estim_1win(ecodata2,CorMethod=“pearson“,widthwin=11,MCSim=1000,Np=6)> XYS<-rolcor_estim_1win(ecodata2,CorMethod=“spearman“,widthwin=11,MCSim=1000,Np=6)> plot_rolcor_estim_1win(ecodata2,corcoefs=XYP$ Correlation_coefficients,CRITVAL= XYP$ CRITVAL,widthwin= XYP$ widthwin,left_win= XYP$ left_win,righ_win=XYP$righ_win,varX=“TSI“,varY=“PC1“,coltsX=“orange“,coltsY=“black“,LWDtsX=2,LWDtsY=2)> plot_rolcor_estim_1win(ecodata2,corcoefs=XYS$ Correlation_coefficients,CRITVAL= XYS$ CRITVAL,widthwin= XYS$ widthwin,left_win= XYS$ left_win,righ_win=XYS$righ_win,varX=“TSI“,varY=“PC1“,coltsX=“orange“,coltsY=“black“,LWDtsX=2,LWDtsY=2)清单4:用于生成示例2的代码(图2) 6)。> XY_P<-rolcor_estim_heatmap(ecodata2,CorMethod=“pearson“,typewidthwin=“FULL“,MCSim=1000,Np=5)> plot_rolcor_estim_heatmap(ecodata2,corcoefs=XY_P$ matcor,CRITVAL= XY_P$ CRITVAL,Rwidthwin=XY_P$ Windows,typewidthwin=“FULL“,varX=“TSI“,varY=“PC1“,coltsX=“orange“,coltsY=“black“,LWDtsX=2,LWDtsY=2)rolcor_estim_热图和plot_rolcor_estim_heatmap。它还比较了使用NonParRolCor中包含的统计学显著性检验估计的统计 学 显 著 性 , 以 及 RolWinMulCor 中 包 含 的 Bonferroni 和Benjamini和Hochberg(BH)的p值校正方法[14]。其主要特点是NonParRolCor的工作方式与这两种p值校正方法大致相似,但我们的统计信号显著性检验比BH更严格,比Bonferroni更宽松。该结果与之前引入并验证该试验的研究一致[15]。Josué M. Polanco-Martínez和José L. 洛佩斯-马丁内斯软件X 22(2023)10135375. 影响和结论科学研究中最常见的任务之一是寻找两个或多个时间序列之间的关系。这主要通过Pearson或Spearman估计相关系数来完成。然而,在整个研究期间估计的相关性作为关联的总体度量,并且两个时间序列之间的关系也可以随时间而变化[3,9]。这里介绍的NonParRolCor R包中的滚动窗口相关函数有助于分析常规的Josué M. Polanco-Martínez和José L. 洛佩斯-马丁内斯软件X 22(2023)1013538见 图 4 。NonParRolCor R 包 中 rolcor_estim_1win 和 plot_rolcor_estim_1win 函 数 输 出 的 视 觉 特 征 , 窗 口 长 度 为 11 年 ( 左 ) 。 第 二 个图 ( 右 ) 使 用RolWinMulCor R软件包创 建[9]。具有统计学显著性(95%置信水平)的滚动相关系数以黑点表示(左侧),0.05或更小的p值位于连续粗水平灰线上或下方(右侧)。 .图五. NonParRolCorR软件包中的rolcor_estim_1win和plot_rolcor_estim_1win函数在81年窗口长度内的输出的视觉特征(左)。第二个图(右)使用RolWinMulCorR软件包创建[9]。具有统计学显著性(95%置信水平)的滚动相关系数以黑点表示(左侧),0.05或更小的p值位于连续粗水平灰线上或下方(右侧)。 .时间序列特别是,他们是有用的,为两个时间序列的某些子区间的系列,即使两者之间的整体相关性是弱或不存在的。这使得NonParRolCor对于分析非平稳时间序列或当两个序列之间的关系不平稳时特别有用。关于R的文献中存在重大空白用于估计滚动窗口相关性的软件包一些例外-[10 ][12][13 ][14][15][16][17][18][19]然而,这些软件包并不包括滚动相关系数的统计显著性估计,更糟糕的是,它们都不包括避免通货膨胀的方法。同时重复多个显著性检验而产生的I类错误。到目前为止,只有一个R包,名为RolWilMulCor,包括解决多重比较问题的统计显著性估计[9]。尽管如此,RolWilMulCor使用了一种经典的方法来纠正p值 , 以 解 决 多 重 比 较 问 题 。 在 本 文 中 , 我 们 提 出 的 包 ,NonParRolCor,包括一个非参数统计显著性检验的基础上蒙特卡洛模拟估计滚动相关系数的重要性,解决多重比较问题。该测试 还 考 虑 了 计 算 滚 动 相 关 的 窗 口 长 度 。 据 我 们 所 知 ,NonParRolCor是第一个R软件包,也可能是唯一一个包含这种估计滚动相关系数显著性的新方法的软件。此外,滚动窗口相关系数可以使用Pearson估计,Josué M. Polanco-Martínez和José L. 洛佩斯-马丁内斯软件X 22(2023)1013539见图6。通过rolcor_estim_heatmap和plot_rolcor_estim_heatmap函数获得的金枪鱼捕获量TSI和PCI之间滚动相关性的热图(顶部中心)。其他两个热图是相同变量的滚动相关性,但使用Bonferroni(左)和Benjamini和Hochberg(右)的p值校正方法。Pearson估计器用于所有三个热图。NonParRolCor的滚动相关系数不具有统计学显著性(> 95%),为空白,RolWinMulCor为绿色[9]。线轮廓指示类似的滚动相关系数。.Spearman或Kendall,并且也可以使用不同的统计显著性水平。拥有用于估计滚动窗口相关性及其统计显著性的软件,特别是在 互 联 网 上 免 费 提 供 的 软 件 , 并 附 有 良 好 的 文 档 , 如NonParRolCor R软件包,使用户能够轻松地自己分析自己的数据。的确,NonParRol- Cor最初是为环境研究而开发的,但它也可用于其他领域,例如:工业,金融服务,在影响和使用方面,CRAN下载统计数据表明,NonParRolCor在2021年3月31日(该软件包在CRAN上发布时)至2023年1月31日期间被下载和安装了5974次。其唯一可以看出,尽管NonParRolCor最近没有在CRAN上发表相应的软件论文,但对这两个软件包的兴趣程度是相似的。 为此因此,我们确信,NonParRolCor的软件论文将展示其主要特性和功能,以及相应的文档,这将增加该计算包的潜在用途。NonParRolCor是自由软件(GPL许可证),可以使用所有主要操作系统(Windows、GNU/Linux和MacOS)都可以使用,并可在CRAN上获得NonParRolCor函数中包含的非参数统计显著性检验是比BH更严格一点比Bonferroni更宽松一点我们的软件包使用并行计算(通过CPU核心),以提高统计显著性估计滚动窗口相关系数。NonPar- RolCor包含四个函数,用于估计和绘制相关系数及其各自的统计显著性。NonParRolCor上可用的功能非常灵活,包括用于控制估计的几个参数相关性和绘图输出的特征包装Josué M. Polanco-Martínez和José L. 洛佩斯-马丁内斯软件X 22(2023)10135310还包含三个辅助数据集,以验证其使用。最后,我们提供了一些例子,显示NonParRolCor的有用性和有效性。竞合利益作者声明,他们没有已知的竞争性财务利益或个人关系,可能会影响本文报告的工作数据可用性数据集包含在CRAN上的R包中确认JMPM向萨拉曼卡大学的西班牙GECOS卓越单位(参考编号CLU-2019-03)提供资金支持。我们要感谢匿名审稿人和编辑Sobie教授,他们的评论和建议对改进本文非常有帮助。引用[1] 皮尔逊湾七. 数学对进化论的贡献三.退化、遗传和泛混合。Philos Trans R Soc London Ser AContain Pap MathPhys Character 1896;(187):253-318.[2] 斯皮尔曼角两个事物之间联系的证明和测量。J Psychol1904;15(1):72-101.[3] Hereina-M,Polanco-Martínez JM,Petritan IC,Petritan AM,Yuste JC.银杉、黑松和苏格兰松生长与气候关系的平稳和非平稳特征。农林气象2022;325:109146.[4] Polanco-Martínez JM.使用非线性、非参数、非平稳方法分析NAFTA股票市场之间的动态关系。非线性动力学2019;97:369-89.[5] [10] Cazelles B,Chavez M,Berteaux D,Ménard F,Vik JO,JenouvrierS,等. 生态时间序列的小波分析。Oecologia2008;156(2):287-304.[6]Polanco-Martínez JM,Fernán-Macho J,Medina-Elizalde M.多变量气候时间序列的动态小波相关分析。Sci Rep2020;10(1):1-11.[7]Yuan N,Xoplaki E,Zhu C,Luterbacher J.一种新的方法来检测多时间尺度上的相关性,具有时间演化和多变量。SciRep2016;6:27707.[8]Lehmann EL , Romano JP. 检 验 统 计 假 设 。 Springer Science&BusinessMedia;2006.[9]Polanco-Martínez J. RolWinMulCor:一个用于估计生态时间序列中滚动窗口多重相关性的R软件包。生态通报2020;60:101163。[10]他R-R。Zoocat:2016年,网址https://CRAN.R-project.org/package=zoocatR包版本0.0.2.[11]Foster J. Roll : 滚 动 和 扩 展 统 计 数 据 。 2020 , URLhttps://CRAN.R-project.org/package=roll R包版本1.1.6。[12]Ulrich J. TTR : 技 术 交 易 规 则 。 2020 年 , 网 址 https://CRAN.R-project 。org/package=TTRR包版本0.24.2。[13]Jevšenak J,LevaniT. dendroTools:R软件包,用于研究树木年轮和日常环境数据之间的线性和非线性响应。 Dendrochronologia2018;48:32-9.[14]Polanco-Martínez JM,López Martínez J. NonParRolCor:滚动窗口相关性的非参数统计显著性检验2022,URLhttps://CRAN.R-project.org/package=NonParRolCorR软件包版本0.8.0。[15]Polanco-Martínez JM,López-Martínez JL.滚动窗口相关性统计显著性检验的非参数方法及其在生态时间序列中的应用。生态通报2021;64:101379。[16] 特 尔 福 德 河运 行 相 关 性 - 运 行成问 题2013,网 址https://quantpalaeo.wordpress.com/2013/01/04/running-correlations-running-into-problems/.[17]Polanco J,Ganzedo U,Sáenz J,Caballero-Alfonso A,
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功