没有合适的资源?快使用搜索试试~ 我知道了~
大规模EEG数据处理与重构工具(DRT):SEDS结构满足跨实验室数据需求
软件X 17(2022)100933原始软件出版物DRT:大规模EEG应用李东a,b,c,刘伟,1,张宇凡a,1,赵玲玲a,郑婷a,王卫东d,李建福a,b,c,龚殿坤a,b,c,刘铁军a,b,c,姚德忠a,b,c,e,刘a成都脑科学研究所临床医院,MoE神经信息重点实验室,电子科技大学生命科学与技术学院,中国四川成都b四川省脑科学与脑启发智能研究所,中国四川成都c中国医学科学院神经信息研究所,中国四川成都d电子科技大学医学院附属肿瘤医院,中国四川成都郑州大学电气工程学院,中国ar t i cl e i nf o文章历史记录:接收6九月2021收到修订版2021年11月16日接受2021年保留字:EEG标准EEG数据结构(SEDS)标准化a b st ra ct当前“开放神经科学”的发展导致了大规模脑电(EEG)应用研究的增加,从而积累了大量的EEG数据。这些海量EEG数据的批量共享和处理在实验室内或跨实验室的EEG研究中起着重要作用,并且导致对现有EEG数据的标准数据文件结构的需求日益增加。在这项工作中,提出了一种新的和更灵活的数据结构,称为标准EEG数据结构(SEDS),以满足单站点研究中的小规模EEG数据批处理和单/多站点研究(特别是在云平台上)中的大规模EEG数据共享和分析的需求。此外,开发了两个版本(MATLAB和Docker版本)的EEG数据文件重构工具(DRT),以根据SEDS重构EEG数据文件。DRT GUI(MATLAB版本)大大减少了新手研究人员所需的时间,而DRT(Docker版本)对于有经验的研究人员来说更有效。所有材料,包括SEDS文档、工 具 、 示 例 数 据 集 等 , 可 在 WeBrain 网 站 ( https://webrain.uestc.edu.cn/ ) 和 Wiki(https://github.com/WeCloudHub/DRT)上查阅。我们希望这两个用户友好的工具箱可以使相对新颖的SEDS更容易进行协作研究,特别是在大规模EEG研究中的应用。版权所有2021作者。由爱思唯尔公司出版这是CC BY-NC-ND下的开放获取文章许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)。代码元数据当前代码版本v1.0此代码版本使用的代码/存储库的永久链接https://github.com/ElsevierSoftwareX/SOFTX-D-21-00166Code Ocean compute capsule法律代码许可证BSD 3条款使用Git的代码版本控制系统使用MATLAB、EEGLAB的软件代码语言、工具和服务编译要求、操作环境依赖性Windows、Linux或MacOS如果可用,链接到开发人员文档/手册https://github.com/WeCloudHub/DRT问题支持电子邮件201922140323@std.uestc.edu.cn地址:四川省成都市西园大道611731号电子邮件地址:Lidong@uestc.edu.cn(李东),dyao@uestc.edu.cn(姚德忠)。[1]这些作者对这项工作作出了同样的贡献。https://doi.org/10.1016/j.softx.2021.1009331. 动机和意义自1929年Berger首次报道人类头皮脑电图(EEG)以来,头皮EEG一直是无创检测大脑活动的常用技术,具有很高的临床应用价值。2352-7110/©2021作者。由爱思唯尔公司出版。这是一篇开放获取的文章,使用CC BY-NC-ND许可证(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表SoftwareX期刊主页:www.elsevier.com/locate/softx李东,张宇凡,赵玲玲等。软件X 17(2022)1009332时间分辨率和低成本。科学报告统计表明,由于脑电图在脑科学中不可替代的价值,它越来越受到人们的关注。开放科学的建议和云神经科学的兴起[2,3]进一步推动了大规模EEG应用的更多努力在EEG社区。此外,还进一步积累了一些公共和本地大型EEG数据集,例如包含30000多个临床EEG的TUH-EEG Corpus数据集( https://www.isip.piconepress.com/projects/tuh_eeg/index.shtml)[4]和包含1500个EEG的https://archive.physionet.org/pn4/eegmmidb/共享和处理这些海量EEG数据集在跨实验室的大规模脑成像合作研究中发挥着重要作用,并进一步增加了对现有大规模EEG数据的标准数据文件结构的要求。此外,在神经科学领域,人们越来越关注数据复制和再现性[7],即,原始数据和分析结果是否能被他人很好地复制[8]。然而,许多潜在的问题,包括各种数据文件结构,混乱的文件组织和缺乏解释的原始,中间和最终数据可能会大大降低数据共享和分析的效率,以及数据的可重复性。因此,需要一种用于大规模EEG共享和处理(特别是使用云高性能计算(HPC)设施)的标准EEG数据文件结构工具,这对于在实验室之间建立更广泛的协作大规模EEG研究至关重要由于EEG的多方面优点,包括重量轻、与环境和系统的高度兼容性、低成本、可穿戴性、无线性等,EEG应用的领域是广泛的。因此,EEG设备制造商远远多于其他非侵入性成像设备制造商,并且这些EEG设备制造商正在使用不同的软件和数据格式构建不同的硬件系统。例如,由Neuroscan EEG系统记录的EEG数据可以使用Curry生成一组“*.dat、*.dap和 *.rs3”文件7,而由Brain Product EEG系统记录的数据可以使用Brain Vision Analyzer生成一组“*.vhdr、*.vmrk、*. dat”文件。此外,由于商业或免费EEG工具总是具有用于处理数据的自己的专有数据格式,因此由不同工具生成的中间和最终EEG数据的文件格式仍然不同(例如,EEGLAB [9]可以以“*.SET”格式保存数据,Curry 7可以以“*. CNT”格式保存数据)。EEG数据文件的这种多样性可能是数据重用以及建立用于跨实验室共享的大规模EEG数据库的障碍。 为了解决上述EEG数据异质性问题,近年来神经科学界已经做出了一些努力。Teeters等人。[10]提出了一种基于HDF 5(http://www.hdfgroup.org/HDF5)的通用神经生理学数据格式;这种格式使用“HDF 5组”作为目录,并使用“HDF 5数组”对应于文件来存储任意数组类型的数据。然而,这种数据标准化主要用于细胞电生理学和光学成像实验的数据,而不是头皮EEG,并且在使用HDF5时必须使用名为HDFView的图形实用程序来浏览文件。比代利沙姆洛 等人开发了一种这种方法的局限性是未满足的需要,易于手动或半自动化的使用,而用户必须手动编程MATLAB脚本导入元数据从半结构化格式,这增加了对新手用户的编程技能的要求。最近,作为对脑成像数据结构(BIDS)的扩展,已经提出了BIDS-EEG [12],用于在脑成像数据结构内容易地组织和共享原始EEG数据。以及脑电图实验室之间的联系。BIDS-EEG的基本定义许多EEG工具和公共数据集都是使用该标准支持或组织的。然而,BIDS-EEG确实具有一些局限性,包括需要支持更多的数据格式(目前支持4种格式)、对单站点中的小规模EEG批处理和跨多站点(特别是在云平台上)的大规模EEG共享和处理的兼容性,以及对“纯"EEG的相对低的灵活性(例如,用于分离的EEG数据而没有其他模态)。在这项工作中,提出了一种新的和更灵活的数据结构,称为标准EEG数据结构(SEDS),以满足单站点研究中的小规模EEG数据批处理和单/多站点研究(特别是在云平台上)中的大规模EEG数据共享和分析的需求该结构可提高EEG数据的可重复性和可扩展性。此外,还开发了两个版本的EEG数据文件此外,由于原始EEG数据的质量评估(QA)是EEG结果再现的重要问题,因此在将数据转换为SEDS时,QA模块作为可选功能集成到DRT中。2. 软件描述SEDS的基本定义假设每个受试者(人-时间)具有仅包含原始/处理EEG数据的一个样本以及元数据文件(即,包含关于数据采集、事件和电极的基本信息的描述性文件)。SEDS的详细规范可参见补充材料,SEDS与当前数据文件结构之间的比较见表1。为了方便地将原始脑电数据转换成SEDS,开发了脑电数据文件重构工具(DRT),为大规模脑电共享和处理提供了一种可行的DRT的设计遵循以下指导原则:(1)非程序员很容易安装和使用它,(2)它可以由开发人员扩展,并与其他EEG工具相结合。2.1. 软件构架DRT的架构如图所示。1.一、 首先,使用DRT导入具有不同数据格式的原始EEG数据,并且配置信息包括采样率、通道位置、事件等,是从原始数据中自动检测出来的。如果原始数据(如接下来,有三个工作流可以使用。(1) ‘‘SEDS’’ only: all raw data files are restructured to the(2) “SEDS-> QA”:所有原始数据文件均重新构建为SEDS,并使用QA模块进行评估。(3)仅“QA”:使用QA模块评估所有原始数据文件。最后,如果适用,可以使用“捕获过滤器”根据关键词过滤SEDS/QA的输出。当前支持的数据格式如表2所示。有关SEDS的材 料 可 在 WeBrain 网 站 ( https://webrain.uestc.edu.cn/ ) 和 Wiki(https://github.com/WeCloudHub/DRT)上查阅。这些材料包括SEDS的规范文件、DRT用户手册、示例数据集以及与DRT的发布、开发和贡献相关的其他信息。此外,在WeBrain云平台上使用SEDS是用户友好的,工作流程包括(1)使用DRT将原始EEG数据文件转换为SEDS zip文件,(2)将这些zip文件上传到WeBrain,以及(3)在WeBrain上管理和分析这些数据李东,张宇凡,赵玲玲等。软件X 17(2022)1009333||Fig. 1. DRT架构概述。首先,使用DRT导入原始数据,并且包括采样率、通道位置、事件等的信息,自动检测。如果原始数据(如“. txt”和“. mat”文件)不包含配置信息,则可以根据需要导入有关采样率和通道位置的基本信息。接下来,可以使用三种工作流。(1)仅“SEDS ":所有原始数据文件均标准化为SEDS。(2)“SEDS-> QA”:所有原始数据文件均标准化为SEDS,并使用QA模块进行评估。(3)仅“QA”:使用QA模块评估所有原始数据文件。最后,如果适用,可以使用“捕获过滤器”根据关键词过滤输出表1SEDS和当前数据文件结构之间的比较SEDsBIDS-EEGESSHDF5文件结构✓✓✓✓支持的EEG格式94––描述文件JSONJSONXML–扩展性✓✓✓✓模态EEGEEGEEG细胞电生理sMRI行为数据光学成像云支持✓✓––工具版本MATLABMATLABMATLABJava/Fortran/C++Docker批处理✓✓✓✓捕获筛选器✓–––Meta信息自动手动手动–手动表2DRT支持的当前EEG数据文件格式制造商/工具/数据文件格式ASCII/Float *.txtBiosemi *.bdfBrainProducts/BrainVision*.vhdr/*.vmrk/*.dat*.vhdr/*.vmrk/*.eegCurry 6/7 *.dat/*.dap/*.rs3EEGLAB *.set/*.fdt欧洲数据格式*.edf*.edf+通用数据格式 *.gdfMATLAB*.mat |*.日期NeuroScan*.cnt |*.eeg |*.avg2.2. 软件使用使用MATLAB 2015b(MathWorks,Inc.,Natick,MA)[13],建议的MATLAB版本是R2014b 或 以 上 。 DRT 的 最 新 MATLAB 版 本 ( v1.0 ) 可 在http://webrain.uestc.edu.cn/ 上 获 得 。 DRT 的 安 装 步 骤 如 下 :(1)下载并解压DRT工具箱;(2) 在MATLAB的主界面上点击“设置路径”按钮,点击“添加文件夹”按钮,在MATLAB中添加DRT的路径;(3)在MATLAB命令行窗口中输入“DRT ",将显示DRT的弹出界面(图1)。 2)的情况。DRT的使用包括以下步骤:(1) 点击“浏览"选择包含EEG数据文件的文件夹的输入路径(例如,“/root/Desktop/RawData”)。单击“浏览”选择目录的输出路径。应该首先创建输出目录(图1)。第2(1)段)。(2) 选择一种模式(图2(2)、“仅SEDS”、“仅QA”或“SEDS->QA”)。(3) 设置与运行模式对应的参数(图2(3-6))。选项的详细说明可参见DRT用户手册的第3李东,张宇凡,赵玲玲等。软件X 17(2022)1009334图二. DRT的弹出界面。MATLAB版本配备了易于初学者使用的图形用户界面。接口面板包括以下各项:(1)输入/输出路径选择,(2)模式选择,(3)SEDS参数设置,(4)扩展QA模块,(5)捕获滤波器,(6)导入采样率和通道位置的基本信息,(7)“ 帮 助 ” 、 “ 取 消 " 和 ” 确 定 “ 按 钮 分 别 用 于 工 具 指 令 、 退 出 DR T 和 运 行DR T 。(4) 点击“OK”按钮(图(2)运行程序。当过程完成时,所有Docker [14]是一种轻量级的容器技术,允许用户将任何应用程序、配置和操作环境打包到一个可以在任何设备上运行的标准镜像中。在操作系统的资源隔离和分配方面,Docker技术比传统的虚拟机技术更具可移植性和高效性。DRT的Docker版本存储在Docker Hub(https://hub.docker)中。com/),这是Docker基于云的注册表服务。Docker Hub基于Docker镜像在整个部署管道中提供工作流自动化。DRT的基于Docker的版本是为有经验的研究人员设计的安装Docker引擎后,最新版本的DRT可以通过运行以下命令在Linux系统上的Windows PowerShell或终端上运行:$ docker pull docker.io/webrain2018/drt_cl下面的Docker命令(图)3)可以启动容器,它是DRT镜像的实例化,并在终端上交互运行/bin/bash(由于-i和-t标志)。Docker引擎将外部读写文件系统附加到容器进行存储(由于-v标志),允许本地数据与本地文件系统中的容器进行交互。镜像名称(webrain 2018/drt_cl:latest)后面是配置参数,其中前三个参数为必填项,表示输入文件路径、输出文件路径和DRT功能模式。图3(4)示出了容器的可选配置参数。-s、-q、-c和-o标志分别表示DRT的SEDS、QA、捕获过滤器和导入信息功能,标志后面是相应功能的配置参数。3. 说明性实例之前的两个数据集用于证明SEDS工具的功能。对于数据集1,在先前的研究中,通过位于标准10-20头皮处的63个电极从42名健康受试者收集静息状态(眼睛闭合)EEG数据集实验前获得所有受试者的书面知情同意书,并获得电子科技大学当地伦理委员会的批准。但原始数据采用BrainVision格式(*.vhdr、*.vmrk、*.dat)(见补充资料第1节),目前国际上提倡的EEG-BIDS不支持这种格式。在这里,我们通过DRT将原始数据标准化为SEDS,DRT支持更多EEG数据格式。结果如图4所示。在输出路径的目录中,自动生成受试者信息 列 表 文 件 ( “subjects_info. csv” ) 、 数 据 信 息 文 本 文 件(“subjects_info. json”)和与每个数据示例对应的文件夹。每个数据案例都与“* events. csv”、“* channels. csv”和“* info. json”文件相关联李东,张宇凡,赵玲玲等。软件X 17(2022)1009335图三.DRT的Docker版本的命令。(1)运行Docker镜像的基本命令行。(2)''$home ''是本地主机的路径,''$InputPath ''和“$OutputPath”需要分别与“InputPath”和“OutputPath”一致。(3) ‘‘webrain2018/drt_cl’’ is the Docker image of the DRT, and the following three (4)可选,详见补充资料第3节。见图4。 数据集1的结果。左侧为42例健康受试者原始数据的标准化文件树结构(见补充资料第1节用于原始数据的原始文件树结构)。(1)“* channels. csv”记录所有电极的空间坐标。(2)“* events. csv”记录类型、延迟以及所有刺激的持续时间。(3)''* info. json ''描述来自原始数据的元数据的数据信息。每个受试者的“results_QA*.mat”文件包含每个步骤的参数和QA结果。“TaskID-1_QA_table.mat”列出了所有受试者的所有QA索引。所有的细节和内容都在第2节中提供补充材料。原始数据(从原始数据中自动提取)。这种方法不仅促进了多站点或云平台中的数据共享和批处理[16],而且还提高了EEG原始数据的可读性和可重复性[17,18],特别是对于跨实验室的大规模脑成像协作研究。值得注意的是,SEDS对于“纯”EEG的组织更加灵活和具体用于分离的EEG数据而没有其他模态),这提高了批量数据处理和大规模数据管理效率。此外,质量评估(QA)的结果可以通过以下方式计算:DRT(如图4右下角所示),包含每个步骤的参数和每个受试者的QA结果的“results_QA*. mat”文件和列出所有受试者的所有主要QA索引的“QA_table. mat”文件。 补充材料的第2节提供了QA结果示例内容的详细信息,QA方法参考可从"www.example.com“获得的QA手册https://webrain.uestc.edu.cn/数 据 集 2 收 集 自 公 共 数 据 库 ( https : //www.cn.org ) 。physionet.org/content/mssvepdb/1.0.0/),其中包含来自11名健康受试者根据快速呈现的李东,张宇凡,赵玲玲等。软件X 17(2022)1009336图五. 数据集2的结果。(a)原始数据的文件树结构。(b)在5 Hz实验条件下原始数据的SEDS。通过使用“5 Hz”作为捕获过滤器,合格的数据文件被过滤并标准化到SEDS中。(c)在6 Hz实验条件下的原始数据的SEDS。(d)的SEDS10 Hz实验条件下的原始数据图像通过快速串行视觉呈现(RSVP)协议以5、6和10 Hz的速度[19]。该实验也得到了当地伦理委员会的批准。对于数据集2,根据实验任务对原始数据文件进行分组和存储,每个文件夹包含一种类型的实验数据(图2)。5(a))。图图5(b-d)示出了DRT整理后的原始数据的文件树结构。由于不同的公共数据集可能不同地组织,公共数据集(部分或全部数据)的批量共享和处理在跨实验室的大规模脑成像协作研究中起着重要作用,这表明对标准数据文件结构的需求日益增加SEDS结构可能通过提供丰富的机器可读元数据来满足这一要求[16],并且它满足了单个站点处的小规模EEG批处理和跨多站点/多站点内的大规模EEG处理。4. 结论基于MATLAB和Docker开发了两个版本的DRT工具箱,用于根据标准EEG数据结构(SEDS)重构EEG数据文件。该系统的开发可满足单点研究中小规模EEG数据批量处理和单点/多点研究(尤其是云平台)中大规模EEG数据共享与分析DRT GUI大大减少了新手研究人员所需的时间,而Docker DRT对于有经验的研究人员来说更有效。我们希望这两个用户友好的工具箱使得相对新颖的SEDS更容易在合作研究中进行研究,特别是对于大规模EEG研究中的应用。竞合利益作者声明,他们没有已知的竞争性财务利益或个人关系,可能会影响本文报告的工作资助信息本研究得到了国家自然科学基金项目(No.81861128001)、中国数据可用性本研究中使用的数据集1可根据相应作者的合理要求提供。论文 中 涉 及 的 数 据 集 2 都 可 以 从 网 站 : https : //www.physionet.org/content/mssvepdb/1.0.0/网站。附录A. 补充数据与本文相关的补充材料可以在https://doi.org/10.1016/j.softx.2021.100933上找到。李东,张宇凡,赵玲玲等。软件X 17(2022)1009337引用[1] 伯 格 · 汉 斯 。 这 是 人 类 的 电 子 游 戏 。 Archiv fürPsychiatrie undNervenkrankheiten1929;87(1):527-70.[2] Koch C,Jones A.神经科学的大科学、团队科学和开放科学。Neuron2016;92(3):612-6。[3] 去云端!一项旨在加速脑科学发现的草根提案。 Neuron2016;92(3):622-7。[4] Obeid I,Picone J.坦普尔大学医院EEG数据库。《前沿神经科学》 2016;10:196。[5] Schalk G等 人, BCI 2000 : 一种 通用 脑机 接口 ( BCI )系 统。 IEEE TransBiomed Eng2004;51(6):1034-43.[6] Goldberger AL等人,PhysioBank、PhysioToolkit和PhysioNet:复杂生理信号新研究资源的组成部分。 循环2000;101(23):E215-20.[7] 约 安 奈 JP , Khoury MJ. 改 进 组 学 研 究 中 的 验 证 实 践 。 Science2011;334(6060):1230-2.[8] 彭路计算科学中的可重复性研究。Science2011;334(6060):1226-7.[9] Delorme A,Makeig S. EEGLAB:一个开源工具箱,用于分析单次试验EEG动力学,包括独立分量分析。神经科学方法学杂志2004;134(1):9-21.[10]Teeters JL等人,《无边界神经数据:为神经生理学创建通用数据格式》。Neuron2015;88(4):629-34.[11]杨文龙,杨文龙,杨文龙.为大规模分析准备实验室和真实世界的EEG数据:集装箱化方法。FrontNeuroinform2016;10(7).[12]Pernet CR 等 人 , EEG-BIDS , 对 脑 电 图 的 脑 成 像 数 据 结 构 的 扩 展 。 SciData2019;6(1):103.[13]吉拉特A.MATLAB软件介绍应用程序。第五版2014年。[14]默克尔·D Docker:轻量级Linux容器,用于一致的开发和部署。LinuxJ2014;2014(239):2.[15]静息状态网络和P3之间的关系:头皮脑电图研究的证据。Sci Rep 2015;5.[16]Maumet C等人,《用神经影像数据模型共享大脑映射统计结果》。SciData2016;3:160102-160102.[17]Nichols TE等人,使用MRI进行神经成像数据分析和共享的最佳实践。NatNeurosci2017;20(3):299-303。[18]Pernet CR等人,使用MEEG进行神经成像数据分析和共享的最佳实践。2018年,OSF预印本。[19]Oikonomou VP等人,对基于SSVEP的BCI的最新算法的比较评估。2016年,arXiv预印本,arXiv:1602.00904。
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功