没有合适的资源?快使用搜索试试~ 我知道了~
软件影响10(2021)100176原始软件出版物njtr1:一个R包,用于使用开放的碰撞数据Gavin C. 罗兹罗格斯大学城市公民信息学实验室,爱德华J.布劳斯坦规划公共政策学院,罗格斯新泽西州立大学,33利文斯顿大街,新不伦瑞克,NJ 08901,美国A R T I C L E I N F O保留字:njtr1道路安全汽车碰撞数据交通事故NJTR-1机动车撞车事故A B标准新泽西州法律要求警察在一个标准化的表格上记录机动车碰撞,该表格被称为NJTR-1。通过这种形式收集的数据包含有关机动车碰撞以及司机,车辆行人参与碰撞的详细信息,这是一个有价值的,但往往未充分利用的资源,用于研究新泽西州的道路安全。本文介绍了njtr1,一个R软件包,使道路安全和城市规划研究在新泽西州,促进容易下载,自动清理和分析的原始碰撞表数据由新泽西州交通部使用R编程语言发布代码元数据当前代码版本0.4.0.9000用于此代码版本的代码/存储库的永久链接https://github.com/SoftwareImpacts/SIMPAC-2021-141可复制胶囊的永久链接https://codeocean.com/capsule/6782509/tree/v1法律代码许可证GPL v3使用git的代码版本控制系统软件代码语言,工具和服务使用R编译要求、运行环境和依赖关系R > 3.5如果可用,请链接到开发人员文档/手册https://gavinrozzi.github.io/njtr1/index.html问题支持电子邮件gr@gavinrozzi.com1. 介绍无论车辆行驶在何处,由于驾驶员的操作,碰撞都不可避免地可能发生。这就是汽车所有权的不幸现实。仅在新泽西州,公路安全保险研究所的数据分析估计,仅在2019年就有525起致命事故造成559人死亡[1]。与其他司法管辖区的官员一样,新泽西州的官员采用了一种标准化的表格来记录该州发生的车祸的实际情况,这种表格被称为NJTR-1表格。新泽西州的警察在事故发生后一直填写NJTR-1表格的纸质副本,保险公司经常使用它们来处理事故引起的索赔。NJTR-1碰撞报告表的标准化性质和通过其实施收集的大量数据使其成为多个利益相关者的丰富数据来源,包括事故现场调查人员,处理车祸索赔的保险公司,寻求识别不安全道路状况的规划人员,以及作为学术研究人员,从使用此表格收集的数据中解决2. 数据作为负责管理本州交通的州政府机构,新泽西州交通部(NJDOT)收集碰撞数据并发布源自NJTR的多个数据表, 1数据在其网站上[2]。本文中的代码(和数据)已由Code Ocean认证为可复制:(https://codeocean.com/)。更多关于生殖器的信息徽章倡议可在https://www.elsevier.com/physical-sciences-and-engineering/computer-science/journals上查阅。电子邮件地址:gr@gavinrozzi.com。https://doi.org/10.1016/j.simpa.2021.100176接收日期:2021年10月25日;接收日期:2021年11月10日;接受日期:2021年11月11日2665-9638/©2021由Elsevier B. V.发布。这是CC BY-NC-ND许可证下的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表软件影响杂志 首页:www.journals.elsevier.com/software-impactsG.C. 罗兹软件影响10(2021)1001762表1通过njtr1软件包提供崩溃数据表车祸发生的时间和地点所有车辆对乘员的特殊碰撞的特征。行人NJDOT公布的五个不同表格的碰撞数据,其中包含描述机动车事故、司机、车辆、车辆乘员行人的记录,这些记录受到新泽西州发生的机动车碰撞的影响,并报告给执法当局。表1概述了通过njtr1包访问表1中列出的每个表名都可以传递给get_njtr1()函数,包将自动生成必要的查询以下载数据,根据所选年份应用适当的模式,并在将数据存储为R表之前清理数据3. 使用NJTR-1数据表寻求使用NJTR-1数据表研究道路安全的新用户通常有一个陡峭的学习曲线,因为从NJDOT网站下载的文件不包含表示每列代表的列标题,并且与数据格式相关的其他问题可能使数据难以加载到统计软件环境中,如R [3]。NJDOT确实发布了几个PDF文件,描述了每个表中包含的每个数据列的内容和正确名称,但这些文件不适合将列标题批量应用于给定的数据表[4]。仅就事故表而言,正确标记数据将需要手动调查和标记50列数据,这不是一项无关紧要的任务,而且容易出现人为错误。数据字段的名称是使用Tabula [5]从这些PDF文件中提取的,并使用janitor R包[6]进行与njtr1包捆绑在一起,以便使这些数据表更适合R用户使用。此外,NJDOT网络界面的界面无法同时下载多年4. njtr1包njtr1包可以通过Comprehensive R Archive Network(CRAN)下载,方法是在R控制台运行该软件包该函数接受崩溃表的年份和类型作为参数,该函数将向NJDOT服务器发出必要的请求,下载清理数据并将结果存储为适合进一步分析和建模的R rame。下载原始数据时,该软件包会根据数据的年份自动应用正确的模式和列标题,以提供干净且可识别的列名。该软件包还可以通过使用'read_njtr1()'函数并将其指向保存数据的路径来读取先前下载的崩溃表的脱机版本njtr1试图通过提供一套功能来解决与这些数据相关的困难,这些功能可以读取,下载和清理机动车碰撞数据,并将其转换为可用于R中道路安全研究的格式。该软件包还将用于促进分析的其他数据集捆绑在一个方便的包装器中。 通过消除与新泽西州的车祸数据工作固有的障碍,njtr1使研究人员能够专注于解决他们的研究问题,而不是清理数据。在其他应用中,分析这些数据可以为数据驱动的交通规划决策和安全干预提供信息,以解决该州内不安全的道路状况5. 机动车事故为了演示如何使用该软件包来可视化州内车祸的空间和时间趋势,2019年使用njtr1包下载并剪辑到 一个新泽西州的shapefile使用R。该数据集包括50个变量的78,969个观察结果。机动车事故空间分布的核密度是使用spatstat软件包为R [8]计算的,搜索半径为1000英尺,结果如下图1下面。从该数据集中选择的变量用于创建图1中的相关图。2,显示了2019年内的变量汽车事故数据集彼此相关,正值表示强相关性,负值表示负关联。在白色方块中未检测到统计学显著相关性。下面介绍了2019年每天发生的车祸总数的时间序列可视化,按新泽西州县分组,以展示该软件包如何用于研究各州之间关于机动车碰撞趋势的差异。 3)。除了描述事故的主要数据集外,还可以下载其他几个数据集,这些数据集可以连接到此表。通过njtr1包提供的每个附加表随后将被介绍。6. 涉及意外的通过njtr1包访问的第二个数据表包含了涉及车祸的行人的数据。此表跟踪有关行人的人口统计信息,以及他们是否被指控与事件有关的违规行为。 图图4显示了新泽西州2019年机动车事故数据说明列数(2017 schema)每一行代表一个2001年至今的事件环境条件512001年至今发生车祸的司机名单21描述2001年参与了一场特别的车祸。40居住者描述2001年至今的人口统计一辆汽车卷入了14行人描述2001年至今的特点35G.C. 罗兹软件影响10(2021)1001763图1.一、 2019年 地理标记的 事故记录的 内 核 密 度 被 剪切到新泽西州的shapefile。图二、相 关图显示了 通 过 nj t r 1 R 包 获 得 的2019年 NJTR-1事故表中 变 量 子 集 之 间 的 关 系 。7. 涉及意外的与行人表一样,该表跟踪人口统计信息并提供相关驾驶员居住地的邮政编码 在事故中。如果对司机提出任何指控, 该表也提供了这一信息8. 事故车辆使用njtr1包可以获得的最后一个数据表跟踪了发生车祸的车辆。该表列出了车辆的制造商和型号,以及有关其在事件中损坏G.C. 罗兹软件影响10(2021)1001764图三. 2019年期间,新泽西州各县每天在NJTR-1数据中报告的机动车事故总数的线图。这些图基于“事故”表可通过包。9. 影响概述图四、 行人年龄直 方 图 涉及新泽西州 车祸的 行 人 (2019年)。通过使可重复的分析能够进行,因为该包提供了一个标准化的方法,用于获取和清洁据作者所知,njtr1是第一个完整的软件包,专门侧重于新泽西州的机动车事故数据,并使专门针对位于该州的社区的研究问题的探索。包年龄填补了一个重要的空白,重点是国家特定的数据集维护的新泽西州官员。通过提供快速获取,清理和分析新泽西州机动车碰撞记录的能力,njtr1软件包使研究人员能够使用R为他们的研究添加另一个有价值的数据层,这些数据可能会产生关于新泽西州道路安全和社区致命车祸原因的更多见解。这套方案有助于道路安全这些数据。此外,该软件包使未充分利用的公共数据集对研究社区更加可用和可扩展10. 相关工作这类软件包已经被证明对寻求使用公共当局保存的碰撞记录研究道路安全趋势的R用户非常有价值。与njtr1最相似的软件包是stats19,它涵盖了在英国境内发生的车祸[9]。njtr1和stats19都提供了类似的功能,并能够解决类似的研究问题,但关键的区别在于G.C. 罗兹软件影响10(2021)1001765因为stats19支持整个国家的数据采集,而njtr1专门针对仅支持新泽西州的数据。 还应该注意的是,其他开发人员之前已经用其他语言(如Python)发布了ad-hoc脚本来下载NJTR- 1数据[10],但这些先前的方法无法提供njtr 1 R包的数据清理功能完整性11. 局限性和今后的工作该软件包的一个关键限制是,它可以提供给用户的数据只能是NJDOT公开发布的最新数据。这会导致最新可用版本收集了大量的碰撞数据,并可供下载。例如,在2021年撰写时,NJTR-1的最新年份 现有数据仅涵盖2019年,过去的数据 2020年尚未公布,2021年也没有任何数据。考虑到这一限制,该软件包将不适用于机动车事故的短期或实时研究,但在用于从可用年份(截至2021年11月的2001-2019年)提取数据时应该相当全面还应该指出的是,这些数据的有用性在很大程度上取决于生成数据的警察人员收集数据的质量。数据中仍然可能存在印刷错误,并且并非每个事故记录都进行了地理编码,因此需要进一步完善数据清理过程并从数据中提取进一步的见解,其中一些可能会在未来通过向包中添加新功能另一个限制因素是,警官引用构成机动车辆违规行为的法规的方式不一致。由于用法不一致,因此很难确定具体机动车辆违规的确切数量。 这个问题可以通过发展 概率分析器或其他工具,用于提取出现在数据中的法规引用的成分,以标记用于识别针对驾驶员的指控者的法律法规引用12. 结论本文介绍了njtr1 R软件包,该软件包通过提供一个接口,可以轻松下载、清理分析新泽西州交通部为R语言环境维护的车祸数据,从而实现新泽西州的道路安全研究,计算的该软件包是第一个专门为研究新泽西州道路安全而设计的软件包,可以支持未来使用R.竞合利益作者声明,他们没有已知的竞争性财务利益或个人关系,可能会影响本文报告的工作附录A. 补充码与本文相关的补充材料可以在https://doi.org/10.1016/j.simpa.2021.100176上找到。用于生成本文中给出的图的补充代码包含在本文中。引用[1]公 路 安 全 保 险 研 究 所 , 2019 年 各 州 死 亡 率 事 实 , 2009 年 ,https://www.iihs.org/topics/fatality-statistics/detail/state-by-state 。 ( 2021 年11月[2]新泽西州交通部,2001年至当前碰撞表,碰撞记录,参考/链接,2021年,https://www.state.nj.us/transportation/refdata/accident/rawdata01-current.shtm。(2021年10月19日查阅)。[3]R核心团队,R:统计计算的语言和环境,2021,https://www.r-project.org/。[4]新 泽 西 州 交 通 部 , 主 文 件 布 局 , 碰 撞 记 录 , 参 考 / 链 接 , 2021 年 ,https://www.state.nj.us/transportation/refdata/accident/masterfile.shtm。(2021年11月9日查阅)。[5] M. 阿里斯塔兰湾 Tigas,J.B. Merrill,J.Das,D. Frackman,T. Swicegood,Tabula:从PDF中提取表格,2018,https://tabula.technology/。(2021年11月9日[6]S. Firke,检查和清理脏数据的简单工具[R package janitor version 2.1.0],2021,https://cran.r-project.org/package=janitor。(2021年11月[7]G.C. Rozzi,下载,分析干净的新泽西州汽车碰撞数据[R包njtr1版本0.3.1],2021,https://cran.r-project.org/package=njtr1。 (2021年10月19日[8]A.巴德利河Turner,spatstat:An r package for analyzing spatial point patterns,J.Stat.软件。12(2005)1 http://dx.doi.org/10.18637/JSS.V012。I06。[9]R. Lovelace,M.摩根湖,澳-地哈马,M。Padgham,stats19:一个处理开放道路碰撞数据的软件包,J.Open Source Softw。4(2019)1181,http://dx.doi。org/10.21105/joss.01181。[10] J.Reiser,新泽西州/DownloadCrashData.py at masterJ.johnjreiser/新泽西州参见GitHub,2015,https://github.com/johnjreiser/NJToolbox/blob/master/dot_crash/DownloadCrashData.py。(2021年11月9日
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功