没有合适的资源?快使用搜索试试~ 我知道了~
软件影响14(2022)100399原始软件出版物iHIBLE:用于探索处方药利用Elin Cho(理学硕士)徐玉婷(硕士)b,Jaejoon Song(Ph.D.)c,a美国德克萨斯州休斯顿德克萨斯大学健康科学中心(UTHealth)公共卫生学院生物统计学和数据科学系b美国马萨诸塞州阿默斯特市马萨诸塞大学数学统计系c美国食品药品监督管理局药物评价和研究中心,美国马里兰州银泉A R T I C L E I N F O保留字:等级聚类地理分析A B标准多年来,处方药数据库的可用性有所增加。药品利用数据通常被构造为随时间的聚集(例如,周、月、年),按地理单位(例如,州、县)。尽管数据的深度和潜在的公共卫生影响,探索跨粒度地理单元的药物利用的时间趋势受到限制。我们引入了一个R软件包ihcycle:(i)识别药物利用随时间发生重大变化的地理区域,以及(ii)表征跨地理区域的随时间模式的共同变化代码元数据当前代码版本0.1.0用于此代码版本的代码/存储库的永久链接https://github.com/SoftwareImpacts/SIMPAC-2022-111可复制胶囊的永久链接https://codeocean.com/capsule/6220920/tree/v1合法代码许可证GNUv3使用Git的代码版本控制系统软件代码语言,工具和服务使用R编译要求、操作环境和依赖关系R>= 2.10如果可用,请链接到开发人员文档/手册https://elincho.github.io/ihclust/问题支持电子邮件elincho524@gmail.com1. 介绍美国食品和药物管理局(FDA)在整个产品生命周期内对药物安全性进行监督[1]。在上市后药物安全性监测中,药物利用数据为监管机构制定监管决策提供了有价值的见解[2,3]。药物分配数据包括在时间范围内聚集的产品分配的数量(例如,周,月)按地理位置(例如,州、县[4]。有几个可用的数据库,以探讨在美国的药物利用。 专有数据库包括IQVIA(原IMS Health)[5也有公开可用的数据,如医疗补助国家药物利用数据(SDUD)[11,12]。Medicaid SDUD代表由州医疗补助机构支付的门诊处方[11,12]。中心疾病控制和预防(CDC)还提供了一个公开的数据,2006-2020年美国县级阿片类药物分配率FDA等监管机构或制药行业经常使用药物利用数据来评估药物或生物制品的真实使用情况[14]。这些数据可以为上市后监测研究的规划提供信息,也可能有所帮助评估监管行动的潜在影响[14]。然而,药物利用数据主要使用简单的描述性分析(例如,国家一级每月使用趋势的列报尽管数据的深度和潜在的公共卫生影响,但用于探索跨粒度地理单元的药物利用时间趋势的统计方法和软件有限。我们引入ihlord,一个开源的R软件包:i)识别药物利用随时间发生重大变化的地理区域,以及(ii)描述时间序列中随时间变化的常见变化模式多个地理区域。本文中的代码(和数据)已由Code Ocean认证为可复制:(https://codeocean.com/)。更多关于生殖器的信息徽章倡议可在https://www.elsevier.com/physical-sciences-and-engineering/computer-science/journals上查阅。∗ 通讯作者。电子邮件地址:www.example.comjaejoon.song @ fda.hhs.gov(J.Song).https://doi.org/10.1016/j.simpa.2022.100399接收日期:2022年6月30日;接受日期:2022年2665-9638/Elsevier B. V.这是CC BY许可下的开放获取文章(http://creativecommons.org/licenses/by/4.0/)。可在ScienceDirect上获得目录列表软件影响杂志 首页:www.journals.elsevier.com/software-impactsE. 周,Y。Xu和J.宋软件影响14(2022)10039922. 软件描述2.1. 软件功能在R统计软件环境中实现了该工具[15]。 R是一个免费软件,可以从https://www. r-project.org/。使用以下命令将软件包安装到R软件中:• install.packages('' ihclust'')• 图书馆示例数据R软件包ihblog包含来自CDC的示例数据集美国阿片类药物分配率地图[13]。这些数据是公开的,包括2006-2020年州和县一级的零售阿片类药物处方配药数据。这些数据可以作为比率获得。每100人的阿片类药物分发量。有关数据源的更多详细信息,请参见CDC数据资源页面[13]。阿片类药物分配率数据可以使用以下命令加载到R• data(opioidData)主要用户功能该包的第一个主要函数testchange()实现了一个排列F检验[16],以识别处方药分发率随时间发生显著变化的地理区域。在该函数的第一步中,我们定义平滑函数表示处方药调剂数据的标准化率测量误差。���������然后,我们使用平滑样条方法估计每个地理单元的这种平滑函数,并将曲线与观测数据的拟合与零处的直截距线进行比较。���������以下假设用于识别随时间显著变化������∶������(���)=0������.���������������对于每个地理单元,= 1,...,,时间������使用F统计量比较零模型与替代模型的拟合优度,并使用排列检验获得拟合值[16]。由于使用Benjamini-Hochberg方法[ 17 ]进行多重假设检验,调整获得的平均testchange()接受以下参数:• 数据-• 时间• perm• nperm至少有10,000种排列组合。• numb为了提高计算效率,采用了并行处理斯皮尔曼等级相关性被用作具有预先指定的阈值的聚类的距离度量[18,19]。第二步:合并其次,在初始化得到初始聚类成员之后,通过对每个聚类中的所有分发率模式进行平均来获得聚类中心。然后,合并步骤通过获得所有对聚类中心之间的斯皮尔曼等级相关性来重新评估聚类成员资格。如果两个聚类中心之间的相关系数大于阈值然后,这两个集群合并成一个新的集群[18,19]。3.修剪第三,修剪步骤通过重新评估每个地理单元的聚类成员关系来简化聚类并去除干扰。在该步骤中,计算聚类中心与每个地理单元中的处方药分配的标准化比率的模式之间的斯皮尔曼等级相关性。如果相关系数小于1,则从给定的聚类中删除地理区域,并重新分配到新的单个聚类中。重复合并和修剪步骤,直到满足我们的收敛标准:所有聚类对之间的相关性都小于1/2[18,19]。iHALK()接受以下参数:• 数据-• smooth• cor_criteria-预先指定的相关系数标准(即,)。默认值:=.75。• max_iteration如果迭代次数达到此值,则迭代停止。默认值:max_iteration= 100。• verbose2.2. 说明性示例我们说 明了在包 中使用两 个主要的 面向用户 的功能( 即,testchange和ihlook)使用示例数据集“opioidData”。这些数据包括2006-2020年期间的阿片类药物分配率县[13]。• opioid_data_noNA- opioidData[complete.cases(opioidData),]• mydata-as.matrix(opioid_data_noNA[,4:18])首先,我们从数据集“opioidData”中删除具有缺失值的县共有2593个县有阿片类药物分发率的完整数据。子集默认值为4。• topF“嗯。”软件包的第二个主要函数ihcloud()使用迭代层次聚类(IHC)获得具有相似时间变化模式的地理区域的聚类[18,19]。IHC是一种无监督聚类算法,使用Spearman秩相关和单个用户指定的参数,在整个过程中使用[18,19]。���IHC执行以下三个步骤以估计平滑function,���int ���(���).步骤1:初始化首先,所述聚类步骤对地理单元处的处方药分发的标准化速率执行分层聚类(例如,州或县)。 通过应用平均轮廓法[20]确定初始聚类的最佳数量,并且代表2006第一步:确定随着时间的推移发生重大变化的领域• testchange_results<-testchange(data=mydata,perm=TRUE,nperm=10000,time=seq(1,15,1))上面的testchange()函数将执行排列测试(nperm = 10000指定10000个排列)并返回排列测试结果(每个县的F值,F值和调整后的F值)。选项time = seq(1,15,1)指定数据中的时间点数量,在本例中表示2006-2020年• 阿片样物质数据变化 <- mydata[testchange_results$p.adjusted.05,]E. 周,Y。Xu和J.宋软件影响14(2022)1003993Fig. 1. 来自6个成员县数量最多的集群的15年以上各县的标准化阿片类药物分发率。红线代表每个群组的平均派药率。使用调整后的平均值,我们将阿片类药物分配率随时间发生显著变化的地区划分为以下显著水平:0.05 并将新数据集保存为“opioid_data_change”。在有完整数据的2593个县中,2454个县被确定为随着时间的推移发生了显著变化。第2步:确定各县随时间变化的共同模式• clustering_results-ihbose ( data=opioid_data_change , smooth=TRUE,cor_criteria = 0.75,max_iteration = 100,verbose= TRUE)将函数ihclock()应用于数据集“opioid_data_change”,以识别共享随时间推移的类似变化的县的集群。ihacks()返回的结果将包括一个名为“Cluster_Label”的对象,该对象列出每个县的集群成员。通过IHC算法鉴定了总共14个簇。图1显示了拥有最多成员国的6个集群。最常见的随时间变化的模式,与1136个县共享,被确定为“集群2”。第二个最常见的随时间变化的模式被确定为“集群1”,与1000个县共享。最超过25个成员国的集群(“集群7”除外2006年至2020年)。3. 影响ihirs包提供了识别随时间变化的地理区域以及表征共享随时间变化模式的类似变化的区域的功能。在iHIVER包中实施的分析管道已在FDA内部使用,以探索多种处方药的使用模式。ihcadine作为R包的发布也将允许FDA以外的用户使用这些方法和软件,使用公开可用的数据源探索感兴趣的处方药的利用情况[11,13]。4. 结论了解处方药在现实世界中的使用方式对于FDA、制药行业或公众等监管机构非常重要。这些数据对于计划上市后监测研究、了解产品的使用情况以及监测美国卫生资源的使用情况非常有价值。使用R包ihlash,用户可以探索粒度地理单元(例如县)的药物利用。竞合利益作者声明,他们没有已知的竞争性财务利益或个人关系,可能会影响本文报告的工作致谢本手稿反映了作者的观点,不应被解释为代表FDA的观点或政策。J.S.受雇于美国食品药品监督管理总局.E.C. 和Y.X.通过与美国能源部之间的一项跨部门协议,由橡树岭科学与教育研究所(ORISE)管理的美国食品药品监督管理局的研究参与计划得到了任命该研究还获得了FDA安全研究兴趣小组(SRIG)项目的资助。引用[1]B.M. Psaty,E.M. Meslin,A. Breckenridge,评估的生命周期方法FDA批准方法和监管行动,JAMA 307(23)(2012)2491-2 4 9 2 , 20 1 2 。[2]J.D.瓦拉克Egilman,S.S. Dhruva等人, 美国食品药品监督管理局要求对2009年至2012年期间批准的新药和生物制剂进行的上市后研究:横断面分析,BMJ 361(2018)k2031,2018。[3] J.J.Skydel,A.D. Zhang,S.S. Dhruva等人, 美国食品和药物上市后要求和上市后承诺的管理利用,2009 -2018,临床试验18(4)(2021)488-499,2021。E. 周,Y。Xu和J.宋软件影响14(2022)1003994[4]R.聪明,CA。Kase,E.A. Taylor等人, 现有数据源的优势和弱点,以支持研究,以解决阿片类药物危机,预防医学。17(2019)101015.[5]K.L.施瓦茨角,澳-地Chen,B.J. Langford等人,验证流行的门诊抗生素数据库,以可靠地识别患者的高处方医生65岁及以上,PLoS One 14(9)(2019)e0223097,2019。[6]K.L.施瓦茨角,澳-地Anchonu,K.A. Brown等人,加拿大安大略省门诊抗生素使用的区域差异:一项回顾性横断面研究,CMAJOpen 6(4)(2018)。[7]洛杉矶Hicks,T. H.小泰勒,R.J. Hunkler,美国门诊抗生素处方,2010年,N。Engl. J.Med.368(2013)1461[8]P.K. Yang,医学博士Ritchey,S. Tsipas,处方中的州和区域差异-和支付相关的促进者坚持血压药物,预防慢性疾病。17(2020)E112。[9]Y. Chen,S. Spillane,M.S. Shiels等人,美国癌症患者中阿片类药物使用的趋势:2013-2018,JNCI Cancer Spectr。6(1)(2022)pkab095,2022。[10] J.Clement , M. Jacobi , B.N. Greenwood, Patient access to chronicmedicationsduring the Covid-19 pandemic : Evidence from a comprehensivedataset of USinsurance claims,PLoS ONE 16(4)(2021)e0249453。[11] Medicaid,Statedrugutilizationdata,2022,https://www.medicaid.gov/medicaid/prescription-drugs/state-drug-utilization-data/index.html。[12] S. Keshwani,M.马奎尔,A。Goodin等人,取消治疗阿片类药物使用障碍的事先授权政策后的丁丙诺啡使用趋势在2个州的医疗补助计划,JAMA健康论坛3(6)(2022)e221757,2022。[13] 疾病控制和预防中心,国家伤害预防和控制中心。美国阿片类药物分配率地图,2022年,https://www.cdc.gov/drugoverdose/rxrate-maps/index.html。[14] 美国食品&药物行政、中心为药物评价和研究(CDER)办公室的监控和流行病学,2022年,https://www.fda.gov/about-fda/center-drug-evaluation-and-research-cder/cder-办公室监测和流行病学。[15] R:A Language and Environment for Statistical Computing,R FoundationforStatistical Computing,维也纳,奥地利,2019年。[16] S. Wu,H. Wu,More powerful significant testing for time course geneexpressiondatausingfunctionalprincipalcomponentanalysisapproaches,BMCBioinformatics 14(6)(2013).[17] Y. Benjamini,Y.控制错误发现率:一种实用而强大的多重测试方法,J.R. Stat.Soc. Ser. B Stat.美沙酮57(1995)289-300。[18] M. Carey,S. Wu,G.甘,H.基于相关性的迭代聚类方法时间进程数据:人类流感感染的时间基因反应模块的识别,感染。Dis. 模型1(2016)28[19] J.宋,M. Carey,H. Zhu,H. Miao,J.C. Ramírez,H. 吴,用高维常微分方程识别潜伏HIV-1再激活过程中的动态基因调控网络,国际计算机科学杂志。生物药物制剂11(2018)135http://dx.doi.org/10.1504/IJCBDD.2018.10011910[20] L. Kaufman , P. P. Kaufseeuw , Finding Groups in Data : An Introduction toClusterAnalysis,John Wiley& Sons,New York,1990。
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- AA4MM开源软件:多建模与模拟耦合工具介绍
- Swagger实时生成器的探索与应用
- Swagger UI:Trunkit API 文档生成与交互指南
- 粉红色留言表单网页模板,简洁美观的HTML模板下载
- OWIN中间件集成BioID OAuth 2.0客户端指南
- 响应式黑色博客CSS模板及前端源码介绍
- Eclipse下使用AVR Dragon调试Arduino Uno ATmega328P项目
- UrlPerf-开源:简明性能测试器
- ConEmuPack 190623:Windows下的Linux Terminator式分屏工具
- 安卓系统工具:易语言开发的卸载预装软件工具更新
- Node.js 示例库:概念证明、测试与演示
- Wi-Fi红外发射器:NodeMCU版Alexa控制与实时反馈
- 易语言实现高效大文件字符串替换方法
- MATLAB光学仿真分析:波的干涉现象深入研究
- stdError中间件:简化服务器错误处理的工具
- Ruby环境下的Dynamiq客户端使用指南
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功