mFLICA:从时间序列推断协调领导力的R软件包.

134 浏览量更新于2024-01-25 收藏 915KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

≥软件X 15（2021）100781原始软件出版物mFLICA：一个从时间序列推断协调领导力的R软件包Chainarong Amornbunchornvej国家电子和计算机技术中心（NECTEC），Pathum Thani，12120，泰国ar t i cl e i nf o文章历史记录：2021年4月23日收到2021年7月20日收到修订版，2021年保留字：时间序列模式启动协调领导a b st ra ct领导是领导者影响追随者以实现集体目标的过程。领导的一个特例是协同模式的启动。在这种情况下，领导者是发起者，他们发起了每个人都遵循的协调模式。给定一组实数的个体多变量时间序列，mFLICA包为R用户提供了一个框架来推断时间序列内的协调事件，这些协调事件的发起者和追随者，以及组合并和分裂的动态mFLICA软件包还具有可视化功能，使领导力推断的结果更容易理解。©2021作者由爱思唯尔公司出版这是CC BY许可下的开放获取文章（http://creativecommons.org/licenses/by/4.0/）中找到。代码元数据当前代码版本v 0.1.1用于此代码版本的代码/存储库的永久链接https://github.com/ElsevierSoftwareX/SOFTX-D-21-00080Code Ocean computecapsulehttps://doi.org/10.24433/CO.4248204.v1法律代码许可证GPL-3使用git的代码版本控制系统使用R、GitHub、TravisCI的软件代码语言、工具和服务编译要求、操作环境依赖性64位操作系统、R（3.5.0版）、R包：stats、dtw和ggplot2如果可用，链接到开发人员文档/手册https://github.com/DarkEyes/mFLICA问题支持电子邮件chainarong. nectec.or.th1. 动机和意义领导力被定义为领导者影响一个群体以实现集体目标的过程[1，2]。领导力的定义之一是模式启动。领导者是发起者，他们发起了每个人都遵循的集体模式（例如，运动发起，股票收盘价趋势）[3]。集体模式或协调事件是旨在实现集体目标的集体行动的新兴事件[4]。在时间序列背景下，协调事件发生时，存在一些间隔，使得一些类似的模式发生在所有时间序列中，每个时间序列的时间延迟可能不同[3]。协调事件的领导者是一个时间序列，它在具有任意时间延迟的类似模式的其他事件之前启动该模式。电子邮件地址：chainarong. nectec.or.th。https://doi.org/10.1016/j.softx.2021.100781时间序列领导推理的相关概念是Granger因果关系[7]（例如Imtest 包 [9] ）和转移熵[10 ， 11] （例如 RTransferEntropy 包[11]）。这两种技术都可以用来推断时间序列A是否是时间序列B的预测因子，这与领导推理中的关系概念类似。然而，领导推理的目的是识别分布在时间序列及其发起者（领导者）之间的模式（例如，移动到相同的轨迹），而不是寻找预测因子。文献中有许多领导方法（见表1）。然而，在文献中还没有一个领导推理R软件包，可以检测多个团队领导者和成员的协调。有关领导力方法的文献综述的更多细节，请参见[3，12]。为了填补文献中的空白，本文中，我在综合 R 档案网络（CRAN）[14]：mFLICA上开发了一个用于R [13]中领导推理的R包。这种方法论2352-7110/©2021作者。由爱思唯尔公司出版这是CC BY许可下的开放获取文章（http://creativecommons.org/licenses/by/4.0/）。可在ScienceDirect上获得目录列表SoftwareX期刊主页：www.elsevier.com/locate/softxChainarong Amornbunchornvej软件X 15（2021）1007812∑=]∈ −[客户端][：][：∈ [] ∈ [− −]∈∈ [−][客户端][客户端]表1领导推理方法的比较。图 1提供了包体系结构的概述。主函数是mFLICA（），它调用两个函数：原始方法域优点和缺点FollNet（）和getFactions（）。getDynamicFollNet（）用于从一组时间序列推断动态跟随网络mFLICA协调启动FLOCK [5]协调启动检测多组长和协调员快速简便的方法昂贵的时间复杂性无法检测多个组而getFactions（）用于推断动态跟随网络中每个时间步的派系领导者和派系成员。在 getDynamicFollNet （）中，它调用followingNetwork（）来推断每个时间间隔的跟随网络，以创建动态跟随网络。followingNetwork（）函数使用以下方法：按时间序列lowingRelation（）作为主引擎来推断以下关系LPD [6]领导者从运动中推断在一小群轨迹中表现良好。在一对时间序列之间建立一个跟随网络。最后，getFactions（）调用getReachableNodes（）来查找派系成员，这些成员是具有指向派系领导者的路径的节点Granger因果关系[7]影响最大化[8]因果推断社会网络分析在一小组时间序列中表现良好。检测社交网络2.2. 软件功能和示例mFLICA的主要任务是（1）推断动态跟随网络，以及（2）推断派系领导者和成员以及领导动态。在本文中，我使用一个模拟数据集TS，其中包含来自[12]的30个运动时间序列，以证明我们的例子-框架基于[3，12]，已经过同行评审，在嘈杂的模拟数据集和真实世界的数据集上进行了测试mFLICA是一个框架，能够：推断协调事件：框架可以推断和可视化具有高度协调的协调间隔;以及推断领导者和追随者的动态：该框架可以推断出协调的领导者和他们的追随者，这些领导者和追随者可以随着时间的推移而改变。mFLICA软件包为科学家提供了分析和产生关于协调活动的科学假设的机会，这些假设可以在统计上和实地进行检验请注意，对于与这项工作相关的函数和定义中的算法的详细信息，请参见补充文件和[3，12]，以了解有关方法学及其理论性能的在领导推理任务中使用mFLICA。该数据集由沿X轴移动的30个个体的二维时间序列组成。时间序列长度为800个时间步长。在由个体ID 1引导的时间间隔[1，200]、由ID 2引导的时间间隔[201，400]和由ID 3引导的时间间隔[400，600]期间数据集包含在此包中。2.2.1. 推断以下关系为了推断两个时间序列之间的以下关系，我部署了动态时间规整（DTW）包[16]来分析两个时间序列之间的图图2显示了[12]中运动的模拟时间序列。在这个事件中，一个领导者向x轴移动，而跟随者在一段时间延迟后跟随它的领导者下面可以定义跟随关系的程度。特性.1.1. 限制s（PL、F）i∈PL，F（sign（ci−ri））|P L,F|（一）mFLICA软件包是基于动态时间规整（DTW）构建的[15]。因此，它是一个可以用来检测领导模式的优化框架。然而，即使该包不能提供任何统计数据作为输出，相反，用户可以从框架输出中获得统计数据。例如，可以通过引导领导者的时间序列来导出特定个体是领导者的置信区间。另一个假设是，框架假设没有在数据集中找不到的外部影响。这意味着，如果数据集包含部分信息而不包括外部影响，则框架发现的领导者可能不是真正的领导者。因此，用户应该仔细解释他们的结果与此假设。2. 软件描述其中PL，F是由DTW和s（PL，F）1，1推断的首标L和后标F的最优翘曲路径。给定阈值σ0，1，如果s（PL，F）1， σ，则L跟随F。若s（PL，F）σ，1，则F跟随L.否则，s（PL，F）（σ，σ）不存在以下关系.在下一个示例中，我还在TS中部署了两个时间序列。在这个数据集中，TS1， 1100是领导者的时间序列，而TS2 1100是跟随者的时间序列。在这个例子中，我只使用时间间隔的前100步。我运行下面的代码来计算leader和follower之间的最佳扭曲路径1234我在第2.1节中提供了mFLICA系统架构的详细信息，然后在第2.2节中描述了软件功能。2.1. 软件构架给定一组时间序列和相关参数作为输入，mFLICA推断以下网络，派系领导人和成员，随着时间的推移协调程度，以及相关的可视化。我调用了dtw（）函数，并将结果记录在obj中，其中obj$index1包含follower的最佳扭曲路径，obj$index2包含leader的最佳扭曲路径这意味着在时间obj$index1i 的跟随者被匹配（最类似于w.r.t.DTW匹配）与时间obj$index2i处的领导者。然后，我计算跟随者到达领导者之前位置的平均时间步数12R>library（mFLICA）R>leader <- mFLICA：：TS[1，1：100，]#最佳时间warpingpath：obj$index2R>f〇ll〇wer <- mFLICA：：TS[2，1：100，]#0ptimalwarpingpath：obj$index1R>obj-dtw（x=follower，y=leader，k=TRUE）#rundtwfrom omR>mean（obj$index1-obj$index2）[1]8. 238462··Chainarong Amornbunchornvej软件X 15（2021）1007813≈[客户端][客户端]==-Fig. 1. mFLICA的软件架构。给定一组时间序列，mFLICA推断以下网络，派系领导人和成员，随着时间的推移协调程度，以及相关的可视化。图二. （a）x轴上的领导者和追随者时间序列。这些位置的时间序列是基于个体在二维平面中的运动而生成的其中引线沿x轴移动。在这个位面，一个追随者朝着它的领导者移动。leader和follower在y轴上的值几乎相同. (b)DTW成本矩阵，其中较深的颜色阴影表示较高的距离。黑线是leader和follower之间的最佳扭曲路径，而蓝线是对角线。（关于此图例中颜色的参考解释，请读者参考本文的网络版本平均而言，追随者需要八个时间步才能到达领导者。接下来，我在等式中计算s（PL，F）。（一）.12这就意味着，领导人和follower（s（P L，F）0. 98 ）。包中的以下ingRelation（）函数用于计算s（ PL ， F）。我部署Sakoe-Chiba Banding [15]以加速DTW计算。带宽限制可以通过lagWindow参数设置。在本例中，我将band参数设置为时间序列长度的10%（lagWindo w= 0）。①的人。12图图3示出了来自两个区间的邻接矩阵。图1中的加权邻接矩阵mat1。3（a）是从组发起移动时的时间间隔1，60计算的。图在图3（b）中，加权邻接矩阵mat2是从每个人都跟随其领导者ID 1时的时间间隔61、 120计算的，这意味着它是高协调事件。mFLICA提供getADJNetDen（），用于从邻接矩阵计算网络根据结果，mat1的网络密度低于mat2网络密度可以计算如下。1234图 3（b），在ID1的行中，所有个体都具有高学位我有s（P L、F）= 0。99在这个例子中这意味着ID1是这个区间的领导者。相比之下，在图中没有个体被大多数跟随。 3（a），这意味着该区间具有较低的2.2.2. 推断以下网络followingNet工作（）函数用于推断以下网络的邻接矩阵。下面的代码用于通过使用一组模拟时间序列TS来推断邻接矩阵，其中包含30个时间序列。低协调间隔[1， 60]和高协调间隔[61， 120]在example.在这个例子中，我设置σ=0，123协同2.2.3. 推理动态跟随网络在这一部分中，我使用了一组时间长度为800个时间步的模拟时间序列TS。在这个数据集中，有三个协调事件：[1，200]、[201，400]和[401，600]。我设置时间窗口ω60，时移δ6，阈值σ 0. 5.接下来的命令用于推断TS的动态跟随网络。12R>library（mFLICA）R> mat 1<-fol lowgNetwork（TS=TS[，1：6 0，]，sigma=0. 5）$adjWeightedMatR> mat 2<-foll owigNetwork（TS=TS[，61：120，]，sigma=0. 第五章）$adjWeightedMatR>library（mFLICA）R>0b>1<-getDynamicFollNet（TS=mFLICCA：：TS[，1：800，]，timeWinndow=60，timeShift=6，sigma=0. 第五章）R>mFLICA：：fol lolgRelat ion（Y=folower，X=leader，lagWindow=0. 1）$follVal [1]0. 99R>getADJNetDen（ mat1）[1]0. 5559004R>getADJNetDen（ mat2）[1]0.7961686R> mean（sign（obj$index1-obj$index2））[1]0. 9846154Chainarong Amornbunchornvej软件X 15（2021）1007814=图三. 不同时间间隔下网络的加权邻接矩阵。矩阵中的元素表示从等式中的s（PL，F）导出的跟随度。其中，领导者是行，而跟随者是列（例如，（i，j）0. 5意味着j以0.5度跟随i）。值越高（浅蓝色）表示跟随关系的程度越高。(a)来自区间[1，60]的矩阵，其具有低协调度。(b)来自区间[61，120]的矩阵，其具有由ID1领导的高度协调。(For对本图图例中所指颜色的解释，读者可参考本文的网络版。）假设我想知道ID19在时间步150处跟随ID1的度数，我可以使用下面的命令12我可以用下面的命令查询时间步150处的网络密度。12网络密度的时间序列可以使用plotMultipleTimeSeries函数。1图4显示了绘图的结果。该图显示有三个具有高网络密度（高协调度）的协调事件：[1，200]，[201，400]和[401，600]，这与我们的地面事实一致2.2.4. 推断领导力动态我使用模拟数据集中的间隔[25，45]来演示多个派别同时发生的时间。在有了一个跟随的网络之后，getFactions（）将邻接矩阵的二进制版本作为其输入。12345请注意，领导者本身也是一个派系成员。由于一共30个人，几乎都是ID1派系的成员。然而，派系大小比为0.5表明派系成员还没有按照相同的模式进行协调。下一个是查询ID为11的派系的详细信息的代码。12345我们可以看到，这一派的成员人数较少。请注意，一个人可以属于多个派系，因为这个人可能遵循一些模式，这些模式似乎与几个领导者的模式部分相似接下来，我将展示如何使用mFLICA来推断派系的动态换句话说，我想找到派系成员和派系领导人随时间的变化。给定一组时间序列TS，输入以及相关参数：时间窗口ω= 60，时移δ = 6，以及阈值σ =0。5、我们在下面运行mFLICA（）12所有派系推理的结果都在obj1中。在这里，我们关注一组派系规模比率的时间序列obj1$factionSizeRatioTimeSeries，其中obj1$factionSizeRatioTimeSeries[i，t]是在时间t由IDi领导的派系的派系规模比率。我们可以使用下面的plotMultipleTimeSeries绘制派系规模比率的时间序列1上面的代码显示在区间[25，45]中有两个派别领导人：ID1和ID11。这意味着有两个派别。下一步是查询ID1的派系的派系成员12345图的结果如图所示。五、根据地面实况，有三个协调事件。首先，在时间间隔[1，200]中，ID1是唯一的领导者，领导着30个人的派系。然后，ID2在时间间隔内领导派系[201，400]。之后，ID3在间隔期间领导派系[401，600]。最后，这群人放慢了速度，停止了移动。图中的结果。五是反映了这一事实。ID1在[1，200]期间有其高派系规模比率，ID2最后，ID3在[601，800]期间没有派系有高的派系规模比率。R>plotMultipleTimeSeries（TS=obj1$faction Siz eRatioTimeSeries，strTite=“FactionSizeRatios“）R>L1-输出$leaders[1]#leaderID1R>out$factionMem bers[[1]]#showfactionMembers[1] 123456789 10 12 13 14 15 16 1718 19 20 21 22 23 24 25 26 27 28 29 30R>out$fact ion SizeRat io[L1]#显示act ionSize比率[1]0. 5034483R>library（mFLICA）R> mat1-followigNetwork（TS=TS[，25：45，]，sigma=0。95）$adjBinMatR>out-getFactions（adjMat= mat1）R>out$leaders#showleaderIDs[1]1 11R>library（mFLICA）R>obj1-mFLICA（TS= mFLICA：：TS[，1：800，]，时间Window=60，时间Shift=6，sigma=0。第五章）R>obj1$dy NetWeightedDensityVec[150][1]0. 7755939R>plotMultipleTimeSeries（ TS=obj1$dyNetWeighted DensityVec，strTitle=“NetworkDnesity“）R>obj1$dyNetWeightedMat[1 9， 1，150][1]0. 9833333#thefollowingdegreforID19follwsID1attimeetp150R>L1-输出$leaders[2]#leaderID11R>out$factionMembers[[2]]#showfaction[1]第11话7 10 13 14 15 16 18 19 20 21 22 23 24 2628 30R>out$fact ion SizeRat io[L2]#显示act ionSize比率[1]0. 1632184Chainarong Amornbunchornvej软件X 15（2021）1007815见图4。从mFLICA软件包中模拟的时间序列TS得到动态跟随网络的网络密度的时间序列。该图显示有三个具有高网络密度（高协调度）的协调事件：[1，200]，[201，400]和[401，600]，这与我们的地面事实一致3. 影响图五、派系规模比率的时间序列。派系大小比率的每个时间序列由其派系领导者的ID（TS#ID）表示文学作品在在线社会行为分析中，[17]中有一项最近的工作，使用mFLICA分析了在过去，许多社会科学问题，包括领导，无法回答定量方法，由于缺乏资源和数据。目前，由于创新和技术的发展，来自在线社交网络和人类、动物甚至人造系统的行为的真实世界传感器的数据都是可用的。这些数据集为研究人员提供了提出问题并定量了解集体行为的机会。在领导力推理中，mFLICA软件包使计算机科学家、社会科学家和研究人员能够定量地测试关于协调领导力的假设。在商业领域，mFLICA能够支持公司从客户记录中衡量其产品在客户中的影响力了解产品的效果是公司获得或损失利润的关键部分在研究领域，目前有一些关于利用mFLICA的潜力的新研究的例子，Twitter在线用户的记录，用于获取有关“无协议”英国退欧的在线辩论的论点结构。在动物行为方面，[18]中的工作利用mFLICA从26只狒狒的GPS轨迹中获得结果，发现狒狒不跟随任何特定的独裁者，但它们跟随群体，这与[19]中的生物学结果一致。此外，在社会科学中，[20]中的工作指出，领导推理框架（例如mFLICA）有可能用于获得人与人之间的因果关系和影响力4. 结论在本文中，详细的mFLICA包从时间序列推断协调的领导。领导者被定义为发起某些模式的个人，其他人在一定时间内遵循相同的模式。时间序列之间的跟随关系可以通过分析Chainarong Amornbunchornvej软件X 15（2021）1007816动态时间规整（DTW）的最优规整路径，这是mFLICA部署的主要组件。给定一组时间序列和相关参数，mFLICA软件包可以推断出两个时间序列之间的以下关系，每个时间步的以下网络，派系领导人，派系成员，协调程度和派系规模比率mFLICA推断的网络密度告诉我们协调的程度：在给定的时间间隔内，有多少时间序列派系规模比率提供关于派系动态的信息;派系领导人和/或派系成员随时间的变化。我们提供了如何使用mFLICA解决领导推理中的许多任务的例子。我们的框架可以应用于任何多变量时间序列。竞合利益作者声明，他们没有已知的竞争性财务利益或个人关系，可能会影响本文报告的工作确认作者要感谢NSF，USA #1514126在开发本工作中使用的方法时附录A.协调领导力推断的定义和伪代码与本文相关的补充材料可以在https://doi.org/10.1016/j.softx.2021.100781上找到。引用[1] 马萨诸塞州霍格领导力的社会认同理论。Pers Soc Psychol Rev2001;5（3）：184-200.[2] 作者：Glowacki L，von Rueden C.领导力解决了小规模社会中的集体行动问题。Philos Trans R Soc B2015;370（1683）：20150010。[3] Amornbunchornvej C ， Brugere I ， Strandburg-Peshkin A ， Farine DR ，Cro- foot MC，Berger-Wolf TY.时间序列数据中的协调事件检测和发起者识别。 ACM 跨知识发现数据 2018;12 （ 5 ）： 53 ： 1-33.http://dx.doi.org/10.1145/3201406，URLhttp：//doi.acm.org/10.1145/3201406网站。[4] 放大图片创作者： Malone TW ， Crowston K. 协调的跨学科研究。ACMComput Surv1994;26（1）：87-119.[5][10]杨晓波，杨晓波，杨晓波.报告移动点对象的轨迹中的领导者和追随者。GeoInformatica2008;12（4）：497-528.[6]Kjargaard MB，Blunck H，Wustenberg M，Gronbask K，Wirz M，RoggenD，等人，用于从移动传感数据检测行人的跟随和领导行为的时滞方法。在：IEEE percom的会议记录。IEEE; 2013，p. 56比64[7]Granger CW. 用计量经济模型和交叉谱方法研究因果关系。Econometrica1969;424-38.[8]Kempe D，Kleinberg J，Tardos J.通过社交网络最大限度地扩大影响力。第九届ACM SIGKDD知识发现和数据挖掘国际会议论文集。 1999，p. 137比46[9]Zeileis A ， Hothorn T. 回归关系中的诊断检查。 R News 2002;2 （ 3 ）：7https://CRAN.R-project.org/doc/Rnews/[10]施赖伯河衡量信息传递。物理评论快报2000;85（2）：461.[11]Beiddt S，Dimpfl T，Peter FJ，Zimmermann DJ. RTransferEntropy-使用有效的传递熵量化不同时间序列之间的信息流。SoftwareX 2019;10：100265.http://dx.doi.org/10.1016/j.softx.2019.100265，URLhttp://www.sciencedirect.com/science/article/pii/S2352711019300779。[12] 放大图片作者：Amornbunchornvej C，Berger-Wolf T.从时间序列推断复杂运动的领导动力学框架。2018年SIAM国际数据挖掘会议论文集。 SIAM;2018 ， p. 549-57. http://dx.doi.org/10.1137/1.9781611975321.62 ， arXiv ：https://epubs.siam.org/doi/pdf/10.1137/1.9781611975321.62.网址epubs.siam.org/doi/abs/10.1137/1.9781611975321.62.[13]RCore团队。R：统计计算的语言和环境。奥地利维也纳：R Foundation forStatistical Computing; 2020，URLhttps：//www.R-project.org/网站。[14]阿莫恩邦克龙维角mFLICA：多变量时间序列的领导推理框架。2020年，R包版本0.1.1。网址project.org/package=mFLICAhttps://cran.r-[15]Sakoe H，Chiba S.口语词识别的动态规划算法优化。IEEE transacoust语音信号处理1978;26（1）：43-9.[16]乔治诺在R中计算和可视化动态时间规整对齐：dtw包。J Stat Softw 2009;31（7）：1-24，URL http：//www. jstatsoft.org/v31/i07/网站。[17]作者声明：John M.在线辩论中论点的展开结构：无协议脱欧的情况。ArXiv预印本ArXiv：2103.163872021。[18]放大图片作者：Amornbunchornvej C，Berger-Wolf T.从运动数据的时间序列推断跟随策略的框架。ACM跨知识发现数据2020;14（3）：1-22。[19]Strandburg-Peshkin A，Farine DR，Couzin ID，Crofoot MC.共同决策驱动野生狒狒的集体运动。Science2015;348（6241）：1358-61.[20]Cook AS，Zill A，Meyer B.观察团队和群体中的领导行为：一种行为学方法来共享领导研究。Leader-shipQ2020;31 （ 2 ）： 101296.http://dx.doi.org/10.1016/j.leaqua.2019.05.003，《领导力的进化与生物学》特刊。网址https：//www.cn.cnsciencedirect.com/science/article/pii/S1048984318302406网站。

下载后可阅读完整内容，剩余1页未读，立即下载