没有合适的资源?快使用搜索试试~ 我知道了~
软件X 21(2023)101297原始软件出版物hdData360r:世界银行集团平台治理、贸易和竞争力指标的高维面板数据编译器马塞尔·T库尔布茨河计算科学系,维格纳物理研究中心,29-33 Konkoly-Thege Miklós Street,Budapest,H-1121,匈牙利数据分析和信息系统研究所,布达佩斯科维努斯大学,8 Festivám Square,Budapest,H-1093,匈牙利ar t i cl e i nf o文章历史记录:收到2022年2022年12月9日收到修订版,2022年数据集链接:https://data。我是你的朋友。[2004 - 05 - 05][2004 - 05 - 05][2005 - 06][2005- 05 - 06][2005 - 06][2005-06]关键词:数据编译器面板数据空间数据治理贸易竞争力a b st ra ct世界银行集团其中包含的数千项治理、贸易和竞争力指标是经济、发展和文化研究、2019年冠状病毒病相关研究和旅游等领域许多研究的基础。所展示的R软件包名为hdData360r,从这些平台收集了全球所有国家的数千个最新年度指标。此外,它还允许使用前几年的数据进行缺失值插补,并且可以选择将生成的数据集导出到制表符分隔值(TSV)文件中。hdData360rR软件包,它生成的样本数据集在GitHub和Mendeley Data上公开提供©2022作者(S)。由爱思唯尔公司出版这是CC BY许可下的开放获取文章(http://creativecommons.org/licenses/by/4.0/)中找到。代码元数据当前代码版本v0.1.0用于此代码版本的代码/存储库的永久链接https://github.com/ElsevierSoftwareX/SOFTX-D-22-00282Code Ocean compute capsule不适用GNU通用公共许可证GNU General Public Licensev3.0使用Git的代码版本控制系统软件代码语言、工具和服务使用R编译和安装要求、操作环境依赖性R 4.1.3或更高版本,依赖项:lubridate,data360r,stringr,dupiter,zoo(如果之前没有安装,这些包会在调用函数时自动安装)。与操作系统无关(Linux、OS X、MSWindows)。链接到开发人员文档和用户手册https://github.com/mtkurbucz/hdData360r/blob/main/README.md问题支持电子邮件kurbucz. wigner.hu软件元数据当前代码版本v0.1.0用于此代码版本的代码/存储库的永久链接https://github.com/mtkurbucz/hdData360r法律代码许可证GNU General PublicLicense v3.0编译和安装要求、操作环境依赖性R 4.1.3或更高版本,依赖项:lubridate,data360r,stringr,dupiter,zoo(如果之前没有安装,这些包会在调用函数时自动安装)。与操作系统无关(Linux、OS X、MSWindows)。链接到开发人员文档和用户手册https://github.com/mtkurbucz/hdData360r/blob/main/README.md问题支持电子邮件kurbucz. wigner.hu*通信:计算科学系,维格纳物理研究中心,29-33 Konkoly-Thege Miklós街,布达佩斯,H- 1121,匈牙利。电子邮件地址:kurbucz. wigner.hu。https://doi.org/10.1016/j.softx.2022.1012971. 动机和意义世界银行集团的2352-7110/©2022作者。 由Elsevier B.V.出版。这是一篇开放获取的文章,使用CC BY许可证(http://creativecommons.org/licenses/by/4.0/)。可在ScienceDirect上获得目录列表SoftwareX期刊主页:www.elsevier.com/locate/softxMarcell T. 库尔布茨软件X 21(2023)1012972----∈∈===联系我们它们所包含的数千项治理、贸易和竞争力指标,是该领域许多研究的基础经济[3,4],发展[5,6]和文化[7,8]研究,2019年冠状病毒病相关研究[9除了广泛的可用指标外,上述平台的主要优势是它们包含了世界各国几十年来的数据。虽然有一个名为data360r的R软件包[14]可以方便地访问GovData360和TCdata360平台,但这个软件包不允许同时下载所有可用的指标。此外,它不允许自动替换缺失值(例如,(包括过去数年的数据),这将大大方便使用已编制的数据集。为了填补这些空白,并支持社会研究中快速增长的数据驱动方法,本研究提出了一个名为hdData360r的新R包。该包不仅从上述平台收集最新的年度指标,还对它们进行预处理以供进一步分析。该软件包基于广泛使用的R脚本的改进版本[10,11,16],与COVID-19报告和data 360指标的通用数据库一起发布(见Kurbucz,2020 [17])。本文的其余部分组织如下。第2节描述了hdData360rR包,以及每个相关的文件。第3节介绍了软件包的安装步骤。第4节给出了该软件包的应用示例。最后,第5节提供了一个影响概述,并总结了本文。2. 软件描述这套名为hdData360r的R软件包收集并预处理了世界银行集团平台上全球所有国家的数千项最新年度治理、贸易和竞争力指标。它包含一个名为get_hdData360的函数,该函数具有一个强制参数和两个可选的用户定义参数。强制性参数(firstYear)指定数据收集的第一年,而第一个可选参数(impute)可用于缺失值插补。get_hdData360函数生成一个列表对象,其中包含面板数据、其指标的元数据、国家数据和数据生成过程的信息第二个可选 参数(writeTSV ) 允许将此 对象导 出为制表 符分隔值(TSV)文件。为了获得GovData360和TCdata360指标,以及国家数据和指标的元数据,应用data360r(版本:1.0.8)R包[14在数据生成过程中使用的其他R软件包有:lubridate(版本:1.8.0)[18],stringr(版本:1.4.0)[19],dupiter(版本:1.0.9)[20]和zoo(版本:1.8-10)[21]。这些软件包在调用函数时自动安装(如果之前没有安装)。hdData360rR包及其生成的示例数据集在GitHub [22]和Mendeley Data [23]上公开提供主文件的属性:get_hdData360 ( get_hdData360.R ) : hdData360rR包包含一个名为get_hdData360的函数。它有一个强制性的和两个可选的用户定义的参数。强制输入参数(firstYear1970年,1971年,. . ,“实际年份")定义了数据收集。 第二输入 参数 (输入0、1、. . .,30)是可选的,它指定了最多使用多少年以前的数据来替换缺失值。也就是说,如果指示符的值是(1,NA,NA),连续三年,则在插补1的情况下,第二年的缺失值(NA)由第一年的值(1, 1,NA)插补。在插补2的情况下,两个缺失值均由第一年的值(1,1,1)插补默认情况下,插补0,这将导致无缺失值插补。第三个参数(也是可选的)(writeTSV,TRUE)允许将生成的对象导出到制表符分隔值(TSV)文件中。默认情况下,它的值为“0”。输出列表对象具有以下结构并包含以下变量:– data:生成的面板数据。iso 3[字符]:ISO 3166-1字母3(三个字母)国家代码。‘‘指标名称根据其标识符和年份确定。– Meta:指标的元数据。id[integer]:指标的标识符。name[字符]:指标的名称。dataset[character]:源数据集的名称。valueType[character]:值类型。DataId[integer]:源数据集的标识符。etLink[字符]:链接到源数据集。defaultViz[character]:默认可视化类型。doNotViz[list]:不能使用的可视化类型。定义[字符]:指标的定义。units[字符]:指标的单位。subindicatorType[字符]:子指标的类型。timeframes[list]:指标的时间范围。周期性[字符]:指示符的周期性。dateRange[ 字 符 ] : 指 标 的 日 期 范 围 。site[character]:Sourcerepository(GovData360 or TCdata360).– ctry:国家数据。id[字符]:国家的标识符。iso 2[字符]:ISO 3166-1 alpha-2(双字母)国家代码。iso 3[字符]:ISO 3166-1字母3(三个字母)国家代码。name[字符]:国家名称。region[字符]:国家的区域。adminRegion:国家的行政区域。incomeLevel[字符]:国家的收入水平。lendingType[字符]:出借类型。capitalCity[character]:各国首都。geo[data.frame]:国家的纬度和经度。– info:数据生成过程的信息timestamp[POSIXct,POSIXt]:数据生成的时间戳。firstYear[numeric]:数据生成的必选参数。·∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗Marcell T. 库尔布茨软件X 21(2023)1012973==impute[numeric]:数据生成的第一个可选参数。get_hdData360函数生成的数据集(hd-Data 360 r''firstYear '' _'' impute '' _''date ''):具有四个制表符分隔值(TSV)文件的目录,这些文件遵循上面详细描述的输出列表对象的结构。3. 安装hdData360r可以使用devtoolsR package安装,如下所示。#I'm all l. packages(“devtools“)#l ib r a r y(devtools)i n s ta l l_g i th u b(“mtkurbucz/hdData360r“)4. 说明性实例本节提供了一个使用生成的数据集的简单示例。在此例子中,我们重点关注2020年各种COVID-19医疗产品的出口和进口值的比例。尽管世界卫生组织(WHO)于二零二零年三月十一日才将COVID-19列为大流行病,但全球超过50个国家的政府已于二零二零年一月限制相关医疗产品的出口[24hdData360r包收集的指标可以帮助获得更深入地了解这些产品的全球贸易网络的变化。为了证明这一点,首先,BACI数据集[27]包含200个国家的双边贸易流量,是从CEPII网站[28]收集的。之后,世界综合贸易解决方案网站[29]被用于识别COVID-19医疗产品(由六位数代码HS-6标记)及其类别。这些措施如下:A:医疗检测包(HS-6:300215、382100、382200、902780);B:消毒剂和灭菌产品(HS-6:220710、220890、284700、300490、380894、841920);C:其他医用耗材(HS-6:280440,300510,300590,300670、340111、340120、392329、392690、481890、901831、901832);D:其他医疗器械和设备(HS-6:732490,841319,901811,901812,901890,902212,902519,902780,902820);E:其他医疗相关货物(HS-6:731100、761300、842139、940290);F:氧疗设备和脉搏血氧仪(HS-6:901819、901839、901920、902680);G:防护服(HS-6:392620,401511,401519,401590,481850、611610、621010、621050、621600、630790、650500、900490、902000);H:车辆(HS-6:870590、871310、871390)。为了直观地显示每个类别的进出口比率与get_hdData360函数收集的各种治理、贸易和竞争力指标之间的关系,使用了tabplot(版本:1.4.1)[ 30 ] R包。该软件包提供表格图来探索和分析大型多元数据集。在我们的例子中,该图的每一列代表一个医疗产品类别,每行代表一个包含来自GovData360和TCdata360平台的100个指标的条形图显示了给定产品类别与箱中包含的指标之间斯皮尔曼相关性的平均值和标准差图的最后一条显示每个箱的GovData360和TCdata360指标的比率。 表格图如图所示。1 .一、在绝对值上,Spearman秩相关系数(ρ 0. 759)在全球创新指数[31]和医疗检测试剂盒的为了说明创新能力如何影响不同COVID-19医疗产品的国际贸易,图2显示了所有产品类别与该指标的关系。如图2显示,与医疗检测试剂盒相比,防护服的进出口比率(例如,手套和口罩)与全球创新指数(ρ 0. 256)。在其他产品中观察到的正相关性中等强。这些结果表明,创新能力较强的国家通常是技术要求较高的医疗保健产品的净出口国。5. 影响和结论hdData360rR包主要支持社会研究中快速增长的数据驱动方法。它从世界银行集团的Gov-Data 360和TCdata 360平台收集了全球所有国家的数千项最新年度治理、贸易和竞争力指标。相对于现有软件包(例如上述平台的data360r应用程序编程接口(API))的主要优点在于,它允许同时下载所有可用的指标。至于其他功能,它可以使用前几年的数据估算缺失值,并且可选地,它将生成的数据集导出到制表符分隔值(TSV)文件中。hdData360r软件包基于改进的版本与COVID-19报告和数据360指标的通用数据库一起发布的广泛使用的R脚本[10,11,16](见Kurbucz,2020[17])。总之,hdData360r函数的价值可以总结如下:hdData360rR功能收集了数千个最新的年度治理、贸易和竞争力指标。或者,它预处理收集的面板数据。它还收集有关国家、指标和数据生成过程的信息。或者,它将面板数据和附加信息导出到制表符分隔值(TSV)文件中。生成的数据集主要支持社会研究中快速增长的竞合利益作者声明以下经济利益/个人关系可被视为潜在竞争利益:Marcell T.Kurbucz报告说,文化和创新部提供了财政支持数据可用性我在手稿中分享了我的数据链接(https://data.mendeley.com/datasets/jwkk44trj3)上提供。致谢由匈牙利国家研究、开发和创新基金资助的文化和创新部的新国家卓越计划NONKP-22-4-II-CORVINUS-55提供支持。∗······Marcell T. 库尔布茨软件X 21(2023)1012974图1.一、2 0 2 0 年新冠医疗产品进出口比与创新能力的相关性(注:斯皮尔曼相关系数用ρ表示。数据按类别A排序。每个箱(行)包含100个指标。最后一条显示源比率垃圾箱).图二. 2020年新冠肺炎医疗产品进出口比例与创新能力的关系(注:斯皮尔曼相关系数注有ρ。贸易比率是用对数尺度来衡量的).引用[1] 世 界 银行 集 团 。 GovData360. 2022 , URL https://govdata360.worldbank 。org/,(2022年12月3日查阅)。[2] 世界银行集团。TCdata360。2022,URL https://tcdata360.worldbank。org/,(2022年12月3日[3] Echevarría CA,García-Enríquez J.阿拉伯之春的经济成本:埃及革命的案例。Empirical Econ2020;59(3):1453-77.[4] 放大图片创作者:Kohler K,Stockhammer E.成长不同?全球金融危机以来的金融周期、紧缩和增长模式的竞争力。Rev Int Polit Econ2021;1-28.[5] [10]李文辉,李文辉,李文辉. 运输走廊更广泛的经济效益:来自国际发展组织的证据。J Dev Econ2022;102900.[6] Munir M,Zakaria ZA,Baig AA,Mohamad MB.通过人类发展水平聚类,建立全球教育指数与人类肥胖的关系。Int J Special Educ 2022;37(3).[7] 吴世石,林晓杰。 Hofstede和Schwartz的价值观框架在不同背景下具有同样的预测性吗?Rev Brasileira Gestú Negressio Cios2019;21:33-47.[8]Belido H,Marcén M,Morales M.志愿活动中的反向性别差距:文化重要吗?可持续发展2021;13(12):6957。[9][10]张文辉,张文辉.关系流动性预测COVID-19的更快传播:39个国家的研究Psychol Sci2020;31(10):1236-44.[10]Kurbucz MT,Katona AI,Lantos Z, Kosztyán ZT.社会因 素在形成 官方COVID-19 报 告 中 的 作 用 : 数 据 驱 动 分 析 。 Int JEnviron Res PublHealth2021;18(4):1505.[11]库尔布茨山为2019冠状病毒病疫情早期官方报告的社会决定因素建模。J ApplSoc Sci2022;16(1):356-63.[12]放大图片作者:Khan MYH,Islam ST,Hassan A.影响孟加拉国旅游业资本投资的因素。《孟加拉国旅游业:投资和发展前景》。Springer; 2021,p.63比78[13]杨毅,范毅,姜丽,刘翔.大流行期间的搜索查询和旅游预测:数字足迹何时何地可以作为预测因素?安娜旅游研究2022;93:103365。[14]RaminR,Onglao-DrilonP.d a t a36 0r “:” TC d a t a3 6 0 “ 和 ” G o v d a t a 3 6 0 “ AP I 的 包 装 器 。R软件包版本2020;1(8)。[15]张军,王伟,夏芳,林永荣,童华。数据驱动的计算社会科学:调查。大数据研究2020;21:100145.Marcell T. 库尔布茨软件X 21(2023)1012975[16]Kosztyán ZT,Kurbucz MT,Katona AI.高维、低样本数据集的基于网络的降维。基于知识的系统2022;109180。[17]库尔布茨山COVID-19官方报告和世界银行集团平台的治理、贸易和竞争力指标的联合数据集。数据摘要2020;31:105881。[18]作者声明:John H. Lubridate使日期和时间变得简单。J Stat Softw 2011;40(3):1https://Www.Jstatsoft.Org/V40/I03/[19]威 克 姆 H 威 克 姆 MH 包 'stringr' 。 2019 年 , URLhttps://cran.r-project.org/web/packages/stringr/index.html。[20]Wickham H,François R,Henry L,Müller K. durr:一种数据操作语法。R包版 本 0.4 。3.R 发 现 统 计计 算 :2015 年 维 也 纳 。 网 址 https://CRAN.R-project.org/package=dplyr。[21] Zeileis A,Grothendieck G.Zoo:S3基础设施,用于定期和不定期的时间序列。统计软件杂志2005;14(6):1-27. http://dx.doi.org/10.18637/jss的网站。v014.i06。[22]库尔布茨山hdData360r:世界银行集团平台治理、贸易和竞争力指标的高维面板数据编译器。2022,GitHub,URLhttps://Github.Com/Mtkurbucz/HdData360r/。[23]库尔布茨山面板数据来自世界银行集团平台的治理、贸易和竞争力指标。2022,Mendeley数据,URLhttps://Data.Mendeley.Com/Datasets/Jwkk44trj3/。[24]警惕GT。共同应对COVID-19:贸易政策层面。技术报告,瑞士圣加仑大学;2020年,URL https://www. globaltradealert.org/reports/51网站。[25]博博CP COVID-19:需求激增、出口限制和质量问题危及贫困国家获得医疗用品 的 机 会 。 COVID-19andTradePolicy : WhyTurningInwardVoxEU.orgWon'tWork2020;31-48,www.example.comeBook,CEPRPressLondon.[26]Grassia M,Mangioni G,Schiavo S,Traverso S.(非预期)COVID-19疫情期间医疗用品出口限制的后果。JComplex Netw2022;10(1).[27]Gaulier G,Zignago S. Baci:产品级国际贸易数据库。2010年。[28]CEPII。BACI。2022,URLhttp://www.cepii.fr/CEPII/en/bdd_modele/bdd_modele_item.asp ? id=37 。(2022年12月3日查阅)。[29]世 界 综 合 贸 易 解 决 方 案 。COVID-19 医 疗 产 品 。2022 ,URLhttps://wits.worldbank.org/trade/covid-19-medical-products.aspx,(2022年12月3日访问)。[30]Tennekes M,de Jonge E.包'tabplot'。2019年,R包,URLhttps://Cran.Microsoft.Com/Snapshot/2018-04-09/Web/Packages/Tabplot/Tabplot.Pdf。[31]世界知识产权组织。全球创新指数。2022,URLhttps://www.globalinnovationindex.org/,(2022年12月3日访问)。
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Haskell编写的C-Minus编译器针对TM架构实现
- 水电模拟工具HydroElectric开发使用Matlab
- Vue与antd结合的后台管理系统分模块打包技术解析
- 微信小游戏开发新框架:SFramework_LayaAir
- AFO算法与GA/PSO在多式联运路径优化中的应用研究
- MapleLeaflet:Ruby中构建Leaflet.js地图的简易工具
- FontForge安装包下载指南
- 个人博客系统开发:设计、安全与管理功能解析
- SmartWiki-AmazeUI风格:自定义Markdown Wiki系统
- USB虚拟串口驱动助力刻字机高效运行
- 加拿大早期种子投资通用条款清单详解
- SSM与Layui结合的汽车租赁系统
- 探索混沌与精英引导结合的鲸鱼优化算法
- Scala教程详解:代码实例与实践操作指南
- Rails 4.0+ 资产管道集成 Handlebars.js 实例解析
- Python实现Spark计算矩阵向量的余弦相似度
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功