没有合适的资源?快使用搜索试试~ 我知道了~
沪公网安备31011502000118号原始软件出版物mics-library:用于多指标类集调查Andrea Bizzegoa,Mengyu Limb,Gianluca Espositoa,b,c,a意大利罗韦雷托特伦托大学心理学和认知科学系新加坡南洋理工大学社会科学学院心理学课程c新加坡南洋理工大学李光前医学院ar t i cl e i nf o文章历史记录:接收12四月2021收到修订版2021年9保留字:低收入和中等收入国家公众健康多指标类集调查a b st ra ct心理社会学研究历来表明,低收入和中等收入国家(LMIC)缺乏代表性,但这些国家面临的问题,特别是在儿童发展和公共卫生领域,更为严重和普遍。为了缩小这一研究差距,多指标类集调查(MICS)是一个适当的和全面的大型数据集,捕捉有关LMIC健康和人类发展的信息。因此,我们介绍了一个工具,旨在帮助研究人员使用MICS数据集,允许数据预览,组织文件和提取相关数据。版权所有©2021作者。由爱思唯尔公司出版这是CC BY许可下的开放获取文章(http://creativecommons.org/licenses/by/4.0/)中找到。代码元数据当前代码版本v1.0用于此代码版本的代码/存储库的永久链接https://github.com/ElsevierSoftwareX/SOFTX-D-21-00065Code Ocean compute capsule法律代码许可证GPL v3使用git的代码版本控制系统使用Python v3.9+的软件代码语言、工具和服务编译要求、操作环境依赖性需要以下Python软件包:numpy、pandas、pyreadstats(如果可用)开发人员文档/手册链接问题支持电子邮件andrea. unitn.it1. 动机和意义低收入和中等收入国家(LMIC)是一个术语, 世界银行和世界卫生组织(世卫组织)将人均国民总收入较低的国家归类。不幸的是,国家之间的经济差距反映在公共卫生问题和人类发展的不同发生率上。众所周知,全球范围内儿童残疾的发生率不均衡,低收入中等收入国家的儿童残疾比例最高[1]。此外,低收入中等收入国家的儿童发展路径与高收入国家不同,*通讯作者。电子邮件地址:gesposito79@gmail.com,gianluca. unitn.it(GianlucaEsposito)。https://doi.org/10.1016/j.softx.2021.100828由于父母和子女的差异[2例如,社会经济地位较低的父母经历了更大的养育压力,这导致了孩子的不良结果[5]。此外,研究表明,由于儿童发育中的外部因素,如不同的环境、表观遗传学、文化进化和内部因素,如基因的差异分布,人类群体之间存在大量的心理和行为差异。因此,一个群体的发现不能自动应用于另一个群体[6]。这些差异限制了现有儿童发展研究的推广能力,需要一种方法来获得在整个LMIC中更具生态有效性和可推广性的研究结果。然而,围绕儿童发展和残疾的大部分研究都是在与高收入国家更一致的文化背景下进行的[7,8],导致LMIC在儿童研究中的代表性不成比例Arnett [9]对几种顶级期刊的分析2352-7110/©2021作者。 由Elsevier B.V.出版。这是一篇开放获取的文章,使用CC BY许可证(http://creativecommons.org/licenses/by/4.0/)。可在ScienceDirect上获得目录列表SoftwareX期刊主页:www.elsevier.com/locate/softxAndrea Bizzego、Mengyu Lim和Gianluca Esposito沪公网安备31011502000118号2+来自心理学不同领域的研究显示,68%的受试者来自美国,96%的受试者来自西方工业化国家,特别是北美和欧洲,以及澳大利亚和以色列,这些国家的人口仅占世界人口的12%与此同时,LMIC严重缺乏专门用于儿童发展的资源,加剧了缺乏研究的影响例如,2012年,27个撒哈拉以南非洲国家的国民生产总值中只有0.01%用于学前教育[10]。因此,中低收入国家在儿童和人类发展研究方面没有代表,同时在这一领域缺乏资源。对这一问题的科学认识正在增长,一些举措侧重于在儿童发展方面进行客观的跨文化研究[11],以弥合研究差距并增强LMIC中儿童的权能[12]。1.1. 多指标类集调查多指标类集调查是研究低收入中等收入国家的一个基本资源,这是儿童基金会和国际社会共同开发的一项具有全国代表性的家庭调查。在LMIC中进行的大多数住户调查都是在MICS下进行的[13]。收集的数据是开放获取的,因此它们可以在不同国家进行比较,并且可以在不同的研究领域使用[14]。儿童基金会于1995年开始实施多指标类集调查方案,以满足开展家庭调查的需要,从而改善儿童、男子和妇女发展的证据基础多指标类集调查为国家、区域和国际各级的执行工作提供了一整套工具和技术援助自开始以来的25年中,MICS包括118个 LMIC的数据,并且是最可靠的定量数据来源之一,可以在世界上许多国家进行比较。MICS定期给药,每次给药波称为一轮。 一般来说,每一轮多指标类集调查都包括一套项目,这些项目来自与人类和儿童发展以及家庭管理有关的物质和社会条件问题。这些项目按问卷进行分组,每一个都集中在一个主题上,例如:“五岁以下儿童问卷”,“家庭问卷”。反过来,调查表又分为若干单元,每一单元针对主要专题的具体方面,如“家庭调查表”中的“纪律单元”,或"五岁以下儿童调查表”中的“照顾单元”。每个单元侧重于特定年龄范围内的特定家庭成员。多指标类集调查的范围很广,包括关于健康、发展和生活水平的指标。多指标类集调查的参与者是以家庭为单位招募的,是在一个分层过程中随机挑选的,该过程从人口普查查点地区开始,然后在每个地区内细分为各个部分一系列科学出版物都是基于多指标类集调查,涉及儿童发育、残疾和教育[15例如,具体的主题包括监测与不同问题有关的健康状况(如未改善的供水[21]或青年人中的烟草和酒精滥用[22]),以及调查世界各地的儿童其他研究关注残疾与父母行为[25访问MICS数据文件是开放的,事先在mics.unicef.org注册,以获得下载和使用数据用于研究目的的许可。有关每个国家/地区的数据使用许可和限制的信息,请查阅许可文件。1.2. MICS的问题尽管所提供的信息很重要,但多指标类集调查在研究中的使用仍然有限。事实上,MICS存在一些使其使用复杂化的问题,我们将其总结为:1. 数据文件的格式(.sav),需要特定的(典型的商业)软件来打开和处理;2. 数据集的复杂性,其中包括数百个不同的文件和文件夹。此外,多指标类集调查各轮和各国家的文件和文件夹名称可能有所不同3. 每个参与者的信息分布在不同的问卷和模块中;4. 在提问和回答的方式上有所保留。例如,表示多项选择题的名义答案的数值可能因国家而异,或反映一个国家的特定特征(例如:教育水平)。1.3. 图书馆的目标图书馆旨在通过解决这些问题来促进多指标类集调查数据的使用。具体而言,它提供了完成以下步骤的功能:(a)预览现有数据;(b)解决不一致问题;(c)提取和导出数据集。EASIS_library用于MICS数据分析管道的开始,以提取感兴趣的信息并获得连贯一致的数据集。它可以用以创建复杂的预处理流水线,或者通过运行一系列模板脚本,这些模板脚本仅需要用户定义感兴趣的指示符。在对多指标类集调查数据进行研究以调查儿童残疾对养育子女的影响[25- 27 ]和儿童死亡原因[ 29 ]的同时,开发了一个图书馆2. 软件描述PICS_library是一个Python(v. 3.9)包,提供了几个处理MICS数据的函数,特别是选择、预处理和提取特定研究的感兴趣项目。它还包括用于数据处理管道高级定制的实用程序和元数据2.1. 软件构架EQUIPMENT_library的函数以MICS数据集为目标,并根据数据处理管道的三个步骤进行组织:Preview_library.preview筛选特定回合中可用的项目;• recode_library.recode用于修复数据中的不一致;• .loaders来提取和导出数据。其他函数在library.utils中提供。Python_library基于Python包pandas和numpy使用DataFrames管理和处理数据,pyreadstat读取原始MICS数据文件。2.2. 软件功能为了符合EQUIPMENT_library函数,MICS数据文件应该按照树结构进行分组。根文件夹应包含每个MICS回合的文件夹(例如,多指标类集调查4、5)。圆形文件夹应包含每个国家的文件夹(例如,莫桑比克、阿根廷),而这些文件又包含数据文件。·Andrea Bizzego、Mengyu Lim和Gianluca Esposito沪公网安备31011502000118号3图1.一、 管道从MICS数据集提取数据,使用mysql_library。左:手动执行的步骤(库函数(可使用MICS_library来支持从MICS中提取一致数据集所需的三个步骤(图11)。1):(a)预览现有数据;(b)解决不一致问题;(c)提取和导出数据集。预览管道的第一步旨在获得一轮MICS中可用信息的总体描述。1B)功能扫描在一轮多指标类集调查中提供的所有文件,并为每个调查表生成一个数据框,列出可用项目的首字母缩略词,以及它们的描述和提供该项目的国家 然后,用户检查数据帧,以列出与感兴趣的研究主题相关的MICS项目(图1)。 1C)。然后,将该函数设置为“review_library.preview.check_values”(图1)。1D)允许用户识别数据中的不一致对于每个选定的项目,该功能为每个国家提供项目说明和答案的数字表示解决不一致问题当相同的首字母缩略词在不同的国家表示不同的问题时,用户应检查原始数据文件,并确定每个国家应使用的正确首字母缩略词 这些可以被定义为一个字典,它将被BLOG_library用来加载正确的首字母缩略词(图10)。 1 E)。不同国家使用的数字表示法必须是一样的在不一致的情况下,用户可以使用格式化的.csv文件,该文件指示应如何重新编码数值以获得一致的信息。review_library.recode.create_recoding_dict 函 数 自 动 读取.csv文件并创建一个字典,review_library将使用该字典来纠正值(图1 E)。提取和导出最后一步是从MICS中提取选定的项目(图1)。1F)。函数fields_library.loaders.import_ dataset使用具有纠正的首字母缩略词和数字表示的字典来一致地提取所选项目;然后函数fields_library.loaders.merge_questio-nnaires用于合并来自不同调查问卷的数据。创建两个DataFrame:第一个包含提取的项目;第二个包含允许在调查问卷之间键既可用于跟踪同一参与者的问卷调查,并链接来自相关参与者的信息;例如,链接母亲和孩子。3. 说明性示例为了更好地描述如何使用mos_library来利用MICS数据,我们给出了代码(图10)。2)提取数据集,调查作为户主的子女或孙子是否我们重点关注第五轮多指标类集调查(2013-2017年),其中涉及47个低收入国家。Andrea Bizzego、Mengyu Lim和Gianluca Esposito沪公网安备31011502000118号4图二、 Python脚本示例,使用mcs_library从MICS中提取数据集。图 三 . 在 典 型 的 管 道 中 创 建 的 DataFrame 示 例 , 使 用 DataFrame_library 从 MICS 中 提 取 数 据 。 A : MICS 调 查 问 卷 中 可 用 项 目 的DataFrame_library.preview.screen 的 结 果 ; B : 每 个 国 家 / 地 区 项 目 描 述 和 数 字 表 示 的 DataFrame_library.preview.check_values 的 结 果 ; C :DataFrame_library.recode.create_recoding_dict用于修复项目数字表示中的不一致。空单元格表示数值不用于特定国家,不构成问题。检查数据帧后(图 3 A)从_library.preview.screen获得(图 2,行6),我们定义一个字典(图。 2,第11行)选择以下 项 目 : “户主的教育水平”(家庭调查表中的HELEVEL)(hh);“与户主的关系”(家庭清单中的HL3)(hl);“儿童可使用的书籍数量”(EC1),“儿童参加早期教育方案”(EC5)和“儿童年龄”(AG2),来自5岁以下儿童问卷(ch)。EC1和EC5可用于指示对资源的访问,HL3将子分类为看 在 的 DataFrames(图3 B) 获得 从_library.preview.check_values(图 二、 线 13)我们Andrea Bizzego、Mengyu Lim和Gianluca Esposito沪公网安备31011502000118号5注意一些不一致的地方。例如,HELEVEL将不同的教育水平与相同的数值相关联。我们通过编辑创建的DataFrames来纠正这些不一致,用正确的数字表示替换答案的含义(图1)。 3 C)。在这个阶段,我们已经可以实现一些数据分析决策。例如,为了简化分析,我们避免考虑所有教育水平,只关注户主是否完成中学教育。出于这个原因,我们需要重新编码为“1”的数字表示在细胞,表明一个二级或更高的指令,并作为“0”的所有其他级别(图。 3C)。数据库.recode.create_recoding_dict(图2,第22行)用于基于指定文件夹(RECODING_BLOG)中存在的格式化.csv文件创建具有重新编码的数字表示的字典。另一个不一致的来源是使用相同的缩写来表示不同的问题。 这可以通过创建一个包含正确首字母缩略词的词典来解决(图2,第25行)。在最后一步中,我们使用正确的首字母缩略词和数字表示法提取所选的项目(_library)。loaders.import_dataset,Fig. 2,第28行),并合并所有的数据帧(数据库.加载器.merge_questionna-ires,图。2,第29行)。在此之后,可以在标准统计管道中使用生成的DataFrame,或者导出以供使用使用其他工具(图2,第304. 影响在PubMED上搜索关键词“多指标聚类调查”,返回2002-2020年期间发表的189项研究。这表明多指标类集调查是科学界众所周知的重要数据集。鉴于在管理和行政方面投入了大量资源和技能,多指标类集调查仍然是监测和调查低收入国家人类发展(特别是儿童和妇女)的关键资源之一然而,多指标类集调查是一个复杂的数据集:例如,第五轮多指标类集调查由400多个文件和文件夹组成,不同国家多指标类集调查的管理和报告数据的方式该库旨在简化从MICS中提取相干数据集的过程,并可以成为基于该数据集扩展研究的关键工具。使用DB2_library可以实现标准化和可重复的数据提取过程,这可以由计算或编程技能较低的通过signi-通过巧妙地减少从MICS 中提取一致数据集所需的时间,MICS_library使研究人员能够专注于从MICS中提取新知识例如,专注于研究的设计,新的计算方法或结果的解释。library是一个开源的非商业软件包,在可复制性方面是一个有价值的资源结果的重要性。首先,用户可以共享数据提取和预处理步骤的代码,以及中间结果:通常这些步骤是手动执行的,基于与软件用户界面的难以再现的交互,并且有时在单独的文件上注释。第二,通过允许将数据导出为非专有文件格式,预计将使用ESPARL_library来支持采用开源管道进行数据分析,例如基于Python或R。反过来,这些管道可以共享;从而促进新研究的发 展 和 结 果 的 验 证 最 后 , 作 为 MICS 研 究 的 参 考 工 具 ,MICS_library对研究团队的贡献是开放的,未来的版本可能会改进功能并添加专门的处理功能。图书馆的影响并不局限于实践方面。事实上,通过促进对LMIC中养育子女和儿童发展的研究,Escherichia_library有助于揭示类似方面如何在高收入国家发挥作用。政策制定者和非政府组织最终可以使用图书馆来通知和推动LMIC的业务决策和实地项目。5. 结论PICS_library是一个Python软件包,用于标准化和方便使用MICS中的数据。特别是,该软件包旨在提供提取一致数据集的功能:PICS_library有效地简化和规范了解决数据不一致所需的步骤,使用户能够专注于识别感兴趣的信息和下游数据分析。我们预计,基于MICS,通过有利于结果的重现性和新研究的发展,使用LMIC_library将对LMIC中的人类发育研究产生重大影响。竞合利益作者声明,他们没有已知的竞争性财务利益或个人关系,可能会影响本文报告的工作资金G.E.由新加坡NAP SUG(M4081597,2015-2021)的赠款支持。A.B.在意大利大学部“Dipartimenti di Eccellenza”方案框架内获得博士后研究金。引用[1]英国政府卫生部。重视人:21世纪学习障碍的新战略。英国:伦敦HM文具办公室;2001年。[2]Fatimilehin Iyabo A,Nadirshaw Zenobia.父母对学习障碍(智力障碍)态度和信念的跨文化研究。《精神障碍研究》,1994年;7(3):202-27。[3]盖 德 · 埃 曼 从 跨 文 化 角 度 看 文 化 态 度 对 智 障 儿 童 融 入 的 影 响 。 Int J InclEduc2004;8(3):311-28.[4]黄兆勇,黄伟杰,何耀生,赖丽嘉,陈伟杰。中国发育障碍儿童家长的需求。J Learn Disabil2004;8(2):141-58.[5]诺埃尔·梅勒妮,彼得森·卡罗尔,杰索·比拉.家庭经济困难学龄前儿童父母压力、儿童气质与语言发展之 关 系 。J. Child Lang 2008;35(4):823[6]Henrich Joseph , Heine Steven J , Norenzayan Ara. 世 界 上 最 奇 怪 的 人 ?Behav Brain Sci2010;33(2-3):61-83.[7]Azhari Atiqah,Truzzi Anna,Neoh Michelle Jin-Yee,Balagtas Jan PaoloM,Tan HuiAnn Hannah,Goh PeiLin Pamela等。婴儿神经影像学研究的十年:我们学到了什么,我们要去哪里?婴儿行为发展2020;58:101389。[8]Henrich Joseph , Heine Steven J , Norenzayan Ara. 大 多 数 人 并 不 奇 怪 。Nature2010;466(7302):29.[9]阿内特·杰弗里·詹森被忽视的95%,对心理学科学哲学的挑战。美国心理学2009;64(6):571-4。[10]儿 童 基 金 会 。 儿 童 早 期 发 展 。 2021 年 , https://www.unicef.org/early-childhood-development。[11]马克·H·伯恩斯坦文化发展科学手册。出版社:PsychologyPress;2014.[12]潘基文儿童与千年发展目标:建立适合儿童生长的世界的进展情况。儿童基金会,2007年。[13]汉斯格鲁·阿提拉阿诺德·弗雷德衡量孕产妇和儿童保健的覆盖面:利用人口与健康调查和多指标类集调查住户调查,跟踪妇女和儿童保健方面的进展情况。PLoS Med2013;10(5):e1001391。Andrea Bizzego、Mengyu Lim和Gianluca Esposito沪公网安备31011502000118号6[14]可汗夏恩,汉哲格鲁阿提拉。多指标类集调查:提供关于全球儿童和妇女的可靠数据。Stud Fam Plan2019;50(3):279-86.[15]伯恩斯坦马克H,普特尼克黛安L,布拉德利罗伯特H,迪特尔-放大图片作者:Deckard Kirby,Lansford.低收入和中等收入国家的性别问题。MonogrSoc Res Child Dev 2016;81(1).[16]伯恩斯坦马克H,普特尼克黛安L,布拉德利罗伯特H,兰斯福德詹妮弗E,迪特尔-戴克德柯比。39个低收入和中等收入国家的照顾者教育、家庭资源和婴儿生长之间的途径。 婴儿2015;20(4):353-76。[17]伯恩斯坦马克H,亨德里克斯夏琳。发展中国家的发育障碍筛查。Soc SciMed2013;97:307-15.[18]杨晓萍,李晓萍. 18个中低收入国家的儿童残疾筛查、营养和早期学习:来自儿童基金会第三轮多指标类集调查(2005-06年)的数据。柳叶刀2009;374(9704):1831-9。[19]夸塔斯豪尔赫,郑约书亚,雷伊格拉卡特琳娜,麦考伊达纳查尔斯,吉川广一 。 低 收 入 和 中 等 收 入 国 家 的 母 亲 、 父 亲 和 其 他 照 顾 者 的 激 励 。 PLoSOne2020;15(7):e0236107.[20]Lansford Jennifer E , Zietz Susannah , Putnick Diane L , Deater-DeckardKirby,Bradley Robert H,Costa Megan,et al. Men's and women's viewson acceptable of husband-to-wife violence and use of porcelain punishmentwithchildrenin21low-andmiddle-incomecountries. 儿 童 虐 待Negl2020;108:104692.[21]Geere Jo-Anne L,Hunter Paul R.运水、供水和卫生设施的使用与妇幼保健的关系。对来自41个国家的49项多指标类集调查的综合分析。Int JHyg EnvironHealth2020;223(1):238-47.[22]Wasil Akash R , Venturo-Conerly Katherine E , Shinde Sachin , PatelVikram,Jones Payton J.应用网络分析了解印度青少年的抑郁症和物质使用。J Affect Disord2020;265:278-86.[23]Graetz Nicholas,Friedman Joseph,Osgood-Zimmerman亚伦BursteinRoy,Biehl Molly H,Shields Chloe等,《非洲教育程度的地方差异》。Nature 2018;555(7694):48[24]夸塔斯豪尔赫,麦考伊达纳查尔斯,雷伊格拉卡特琳娜,布里托皮亚雷贝洛,比阿特丽斯伊丽莎白,萨利卡梅尔。低收入和中等收入国家的幼儿期暴露于非暴力纪律和身心攻击:国家,区域和全球流行率估计儿童虐待Negl2019;92:93-105.[25]比泽戈安德烈,林梦雨,斯齐亚冯格里塔,埃斯波西托詹卢卡。 低收入和中等收入国家中有发育障碍的儿童:更多地被忽视和体罚。Int J Environ ResPublic Health2020;17(19):7009.[26]Bizzego Andrea , Lim Mengyu , Schiavon Greta , Setoh Peipei , GabrieliGiulio,Dimitriou Dagmara等人,《低收入和中等收入国家的儿童残疾和残疾:开放数据的大数据方法》。Res Dev Disabil2020;107:103795.[27]Bizzego Andrea,Lim Mengyu,Dimitriou Dagmara,Esposito Gianluca.家庭网络在低收入和中等收入国家抚养残疾儿童时的作用。Disabilities2021;1(1):58-68.[28]放大图片创作者:J.低收入和中等收入国家儿童残疾与照顾者纪律和暴力之间的关联。儿童发展2014;85(2):513-31。[29]Bizzego Andrea , Gabrieli Giulio , Bornstein Marc H , Deater-DeckardKirby , Lansford Jennifer E , Bradley Robert H , et al. Predictors ofcontemporaryunder-5 child mortality in low-and middle income countries:a machinelearningapproach. Int J Environ Res Public Health 2021;18(3):1315.[30]郑乔舒亚,麦考伊达纳查尔斯,芬克冈瑟。44个低收入和中等收入国家的父母教育、照顾者对学习的支持和幼儿发展之间的途径。早期儿童研究Q2017;41:136-48。
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- SSM动力电池数据管理系统源码及数据库详解
- R语言桑基图绘制与SCI图输入文件代码分析
- Linux下Sakagari Hurricane翻译工作:cpktools的使用教程
- prettybench: 让 Go 基准测试结果更易读
- Python官方文档查询库,提升开发效率与时间节约
- 基于Django的Python就业系统毕设源码
- 高并发下的SpringBoot与Nginx+Redis会话共享解决方案
- 构建问答游戏:Node.js与Express.js实战教程
- MATLAB在旅行商问题中的应用与优化方法研究
- OMAPL138 DSP平台UPP接口编程实践
- 杰克逊维尔非营利地基工程的VMS项目介绍
- 宠物猫企业网站模板PHP源码下载
- 52简易计算器源码解析与下载指南
- 探索Node.js v6.2.1 - 事件驱动的高性能Web服务器环境
- 找回WinSCP密码的神器:winscppasswd工具介绍
- xctools:解析Xcode命令行工具输出的Ruby库
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功