没有合适的资源?快使用搜索试试~ 我知道了~
软件X 22(2023)101358原始软件出版物BayesESS:一种用于量化贝叶斯分析宋在俊a,宋俊,森田聪b,郭英伟c,J.杰克·李a美国食品药品监督管理局生物统计办公室,Silver Spring,MD 20993,USAb京都大学医学研究生院生物医学统计学和生物信息学系,日本京都606-8507c德克萨斯大学MD安德森癌症中心生物统计学系,美国德克萨斯州休斯顿77030ar t i cl e i nf o文章历史记录:收到2021年2022年6月4日收到修订版,2023年保留字:贝叶斯分析有效样本量后验分布R包代码元数据a b st ra ct贝叶斯推理已经成为一个有吸引力的选择,科学家寻求将先验知识纳入他们的建模框架。虽然R社区一直是促进贝叶斯统计分析的重要贡献者,但一直缺乏评估先验知识对这种建模框架在本文中,我们介绍了BayesESS,一个全面的,免费的,开源的R包,用于量化贝叶斯分析中参数先验的影响。我们还介绍了一个附带的基于Web的应用程序,用于估计和可视化贝叶斯有效样本量,以进行或规划贝叶斯分析。©2023由Elsevier B.V.发布这是CC BY许可下的开放获取文章(http://creativecommons.org/licenses/by/4.0/)中找到。当前代码版本0.1.19用于此代码版本的代码/存储库的永久链接https://github.com/ElsevierSoftwareX/SOFTX-D-21-00150当前可执行软件https://cran.r-project.org/web/packages/BayesESS/index.htmlGNU通用公共许可证(GPL)使用git的代码版本控制系统使用R、C++的软件代码语言、工具和服务编译要求、操作环境Windows、Linux和macOS; R包依赖项:MCMCMCpack、LaplacesDemon、Rcpp、dfcrm、MatrixModels、MASS、RcppArmadillo、RcppEigen如果可用,链接到开发人员文档/手册https://cran.r-project.org/web/packages/BayesESS/BayesESS.pdf问题支持电子邮件jaejoonsong@gmail.com软件元数据当前软件版本0.1.19此版本R软件包可执行文件的永久链接:https://cran.r-project.org/web/packages/BayesESS/index.html;基于Web的应用程序https://ibl.mdanderson.org/shinyapps/BayesESS/GNU通用公共许可证(GPL)计算平台/操作系统Windows、Linux和macOS安装要求R包:MCMCMCpack,LaplacesDemon,Rcpp,dfcrm,MatrixModels,MASS,RcppArmadillo,RcppEigen如果可用,请链接到用户手册-如果正式出版,请在参考列表中引用该出版物https://cran.r-project.org/web/packages/BayesESS/BayesESS.pdf问题支持电子邮件jaejoonsong@gmail.com1. 动机和意义在贝叶斯推理中,关于参数的当前知识状态或不确定性被表示为概率分布,或者简而言之,先验[1]。这样的知识状态是更新的*通讯作者。电子邮件地址:jaejoon.song @ fda.hhs.gov(Jaejoon Song).https://doi.org/10.1016/j.softx.2023.101358通过数据,产生一个新的分布,或者简而言之,后验分布。使用后验分布进行有关感兴趣参数的推断,后验分布是来自先验分布和数据的信息的反映[1]。开源软件社区积极促进贝叶斯分析的计算工具,目前至少有113个与贝叶斯推理相关的软件包2352-7110/©2023由Elsevier B. V.出版这是CC BY许可下的开放获取文章(http://creativecommons.org/licenses/by/4.0/)。可在ScienceDirect上获得目录列表SoftwareX期刊主页:www.elsevier.com/locate/softx宋在俊,森田聪,郭英伟等。软件X 22(2023)1013582=||∫|||||||||y我Comprehensive R Archive Network(CRAN)然而,在软件中存在评估先验知识的影响的空白在这样一个模型框架中。在贝叶斯范式下的临床试验设计和分析中,通常有兴趣评估后验信息量,这受到信息先验选择的影响[2在统计文献[4]中,讨论了选择 特定先验分布 对后验分布 的影响, 作为有效样 本量(ESS)。ESS量化了样本量单位中先验分布的选择对后验分布的影响程度。该方法在生物统计学文献中已被广泛接受,因为在设计研究时,样本量应区分本文在马尔可夫链蒙特卡罗(MCMC)抽样的范围内讨论有效样本量前者(ESS,如本文所定义)用于量化和传达先验的影响,后者用于衡量MCMC样本的有效性。2. 软件描述我们提出了BayesESS,一个免费的,开源的,全面的R包和基于Web的应用程序,用于量化贝叶斯分析中参数先验的影响。我们的R包可以用于确定存在封闭形式解的平凡情况下的ESS(例如,共轭模型如β-二项式、γ-指数、γ-泊松、狄利克雷-多项式、线 性 回 归 、 逻 辑 回 归 或 事 件 发 生 时 间 模 型 ) 。 R 包 可 从CRANhttps://cran.r-project.org/web/packages/BayesESS 获 得 。可从https://biostatistics.mdanderson.org/shinyapps/BayesESS/获得附带的交互式基于网络的应用程序,以允许用户通过可视化进一步探索参数先验的影响基于Web的应用程序也可以被科学家用来代替R包,不熟悉R编程语言。在这篇文章中,我们展示了软件估计贝叶斯ESS的规划或进行贝叶斯分析的目的。2.1. 模型描述虽然在频率论框架中参数被假设为固定量,但在贝叶斯观点中它们被视为随机变量[1]。在本节中,我们将介绍一些符号来说明贝叶斯推理中常用的方法。让yy1,. . . ,y,n是来 自 a 的大小为n的 随 机 样 本 ,随机变量Y假设我们对一个参数θ感兴趣。然后,我们将p(yθ)记为上的密度函数族,y,由随机变量θ参数化。我们称这个族p(yθ)为数据y的似然函数或似然模型,给定由θ的任何值指定的模型。先验分布2.1.1. 前科类型先验分布在贝叶斯分析中起着核心作用包含最少信息的先验被称为无信息先验(也称为参考先验或客观先验)。当有必要将现有的(例如,临床)知识(参见附录1中使用信息先验的贝叶斯模型示例)。信息先验的推导可以基于纯粹的判断,数据和判断的混合,或数据单独[1]。2.1.2. 确定ESS的解析方法一些简单的贝叶斯模型(参见附录2中描述的共轭模型)提供了参数先验影响的封闭形式量化[1]。然而,许多常用的统计模型,如线性或逻辑回归或至事件时间模型,并没有扩展ESS的封闭式表达式[2Morita等人[4,5]提出的一种技术可用于在一般条件下确定ESS,即使在后分布难以处理的情况下。假设我们有一个随机的数据样本Y,它是从一个参数为θ的基础分布中生成的。森田等人的方法背后的主要思想[4]是计算前分布之间的距离,interest(记为p(θθ),其中θ表示超参数)和a后验分布(qm(θθ<$0,ym))使用具有可忽略信息量的先验(表示为q0 (θθ<$0 ),其中θ<$0表示超参数)生成。参考先验(q0(θθ<$0))为用相同的平均值(和相同的相关性结构)指定如果先验分布指定有多个参数,则参数之间的真实性),同时膨胀方差。后(qm(θθ=0,ym))具有一个独立的恒等式,大小为m 的均匀 分布(i.i.d ) 样本。 ESS被识别 为样本大小(m),其最小化先验分布之间的距离。感兴趣的分布(p(θθ))和后验分布(qm(θθ0,ym))。ESS提供了对先前质量标准影响的直观评估,并参考了观察数据中的样本量。例如,如果当待分析的观测数据具有25个观测值时,感兴趣的先验表明ESS为50,则很明显,这意味着先验将主导后推断。在下面的部分中,我们将说明如何在一个简单的贝叶斯共轭模型中识别ESS2.1.3. 共轭模型中ESS的图示(Beta-二项式)给定一个具有分布p(yθ)的数据集,如果先验分布在共轭分布族中,则不管数据的观测值如何,后验分布在共轭分布族中,则称一个分布族与给定分布共轭[1](共轭先验的例子见附录2这种先前的突出经常被使用,因为后部很容易处理,方式(即,不需要计算积分p(yθ′)p(θ′)dθ′贝叶斯法则的分母在本节中,我们将说明β-二项式模型中ESS的定义。假设我们有从m个可交换的伯努利试验y1,. . .,y m,其中yi= 1被标记为“成功”并且yi=0被标记为“失败”。则s∑成功次数描述参数θ的不确定性的参数表示为如p(θ)。从这些量,贝叶斯推理的目标是在观察数据后获得有关感兴趣参数(θ) 这种更新以称为后验的密度表示,表示为p(θ|y)。使用贝叶斯在m次试验中,表示为二项分布Bin(m,θ),使得:fm(ym|θ)=(m)θ y(1−θ)m-y。nYi规则,后验可以确定为:P(y)= p(y|θ)p(θ)p(y|θ)p(θ)假设我们有兴趣使用beta先验(超先验α和β)。 为了识别ESS,后椎间盘-θ|p(y) =p(y|θ′)p(θ′)dθ′。(qm(θ|θ=0,y(m))可以用β先验公式表示宋在俊,森田聪,郭英伟等。软件X 22(2023)1013583[<$y+ −1]m−y+−1M0CCδ(m,θ,p,q0)=θ<$2 +(1−θ<$)22+(7)2−C+C(七)二CC图1.一、 函数δ(m,θ<$,p,q0)的曲线图。用相同的平均值和膨胀的方差指定的分布,如下所示,其中c假定为非常大的常数。q(θ|θ=p(θ|α,β)=B(α,β)θα−1(1−θ)β−1<$θα−1(1−θ)β−1,2.2. 软件构架下面的代码可以用来安装R包BayesESS。00cCcCcC c cR>install.packages(“BayesESS”)请注意,ESS计算的目的是参考观察数据中的样本量(m),对先前质量标准的影响进行直观评估。因此,ESS被确定为样本大小(m),其最小感兴趣的先验分布之间的距离(p(θ|θm))和后验(qm(θ|θ=0,ym)),写为我们提供了一个附带的基于Web的交互式应用程序BayesianEffective Sample Size Calculator,以允许不了解R编程语言的个人轻松计算ESS(图1)。2)的情况。 该应用程序及其使用手册可以从https://biostatistics.mdanderson。org/shinyapps/BayesESS/.q(θ|θm,y)<$θy+ α −1(1 − θ)m−y+β −1。2.3. 软件功能让我们将感兴趣的先验分布与后验分布之间的距离记为δ(m,θ<$,p,q0)。在这个简单的贝叶斯模型,距离的封闭形式解如下所示(完整的代数细节见附录3)。<$[α−1β−1]R包BayesESS可以用于确定存在封闭形式解的平凡情况下的ESS(例如,共轭模型,例如β-二项式、γ-指数、γ-泊松、狄利克雷多项式、线性回归、逻辑回归或事件发生时间模型)使用Morita等人[4]提出的技术(参见第2.1.2节;近似策略的更多细节可以在α-θ′2β+(1−θ<$)2。附录5)。3. 说明性实例如果我们对包含在先验θ<$Beta(3, 7)中的信息感兴趣(即, α = 3,β = 7),则θ<$= 3/(3 + 7)=。3,y=。3m.当c被设置为非常大的常数时:[26][. 3 m+3− 1m −。3m+7−1]3.1. 共轭模型下面,我们说明了贝叶斯ESS R包在识别ESS中的使用,用于上一节中讨论的β-二项式示例。选项model. 3 .第三章。26+. 32.]−[. 3 m−1+。7 m −1]。二项式模型,先验信息在先验项下详述。在在这个简单的例子中,ESS是10,正如我们在图1中所确定的。. 32(。(7)2. 32(。(7)2Mδ(m,θ<$,p,q0)=≈[宋在俊,森田聪,郭英伟等。软件X 22(2023)1013584=R>library(BayesESS)R>ess(model='betaBin',prior=c(' beta ',3,7))绘制函数δ(m,θ<$,p,q0),对于m的递增值,我们可以看到δ(m,θ<$,p,q0)的最小值是m10。的图是图的再现。 1在由Morita et al. [4]的文件。ESS是针对β-二项式模型 ESS计算的,β(alpha,beta)先验为:10宋在俊,森田聪,郭英伟等。软件X 22(2023)1013585|=+−∑−==2)αβ˜ ˜˜图二. ESS计算使用基于Web的应用程序。函数ess在R包BayesESS中普遍使用,用于计算各种贝叶斯模型的ESS。期权模型和先验被用来指定模型的细节。选项详细信息可在软件包手册中找到。 在共轭贝叶斯模型中使用贝叶斯ESS计算ESS的更多示例见附录2。3.2. 在线性回归模型对于许多常用的统计模型,包括线性回归(参见附录6中的模型详细信息),没有闭合形式的解决方案。BayesESS可用于确定此类情况下的ESS,使用Morita等人[4]描述的基于模拟的数值近似(近似策略详情见附录5)。假设我们有一个大 小 为m ,y1,. . . ,y m,来自正态分布YiXi,θN(µi,1/τ),其中µi αβ(Xi X<$),τ表示a精度参数为线性回归模型指定model='linreg',先验信息在先验下详细说明。选项label用于为输出提供标签,ncov用于指定线性回归中协变量的数量,m=50用于指定搜索ESS的最大值的正整数,n=1000用于指定数值近似的模拟数量。更多的输入细节在软件包手册中讨论库(BayesESS)#具有一个协变量的线性回归模型#先验指定为:#beta0 ~ N(0,1),beta1 ~ N(0,1),tau ~Gamma(1,1)> ess(model='linreg',label=c('beta0','beta1 ',' tau'),+ prior=list(c('norm',0,1),c('norm',0,1),c('gamma',1,1)),+ ncov=1,m=50,nsim=1000,svec1=c(0,1,0),svec2=c(0,0,1))p(y|X,θ)=(τ二分之一-τ(y−µ)2)ESS计算线性回归模型我i2π)exp(2i iτ1/2=(2π) exp(−τ(yi−(α+β(Xi−X<$)2),i=1,. . . ,n,ESS子向量1:第一子向量(beta 1)的ESSESS子向量1:第二子向量(tau)的ESS大小为m的随机样本的可能性可以写为如:$ESS subvec1f m(y|X,θ)=τm/22π实验的)nτ2i=1(yi−(α+β(Xi−X<$)2),[1] 3.056997$ESS subvec2[1]1.9998其中参数向量θ包含三个参数θ(θ1,θ2,θ3)(α,β,τ)。θ的先验分布可以指定为p(θ|θ1)=p1(θ1,θ2|θ=1,θ=2)p2(θ3|θθ3)=N(θ1|μπα,σπ2)·N(θ2|μπβ,σπ2)·Gamma(θ3|a、b、c),4. 影响贝叶斯推理越来越受到科学家的关注,他们试图将先验知识纳入他们的建模框架。虽然一些简单的贝叶斯模型(例如,conju-α β门模型,如β-二项式,伽玛指数,正常其中θ=1(即, µα,σ2),θ2(即, 3、(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)(1 a,b)表示θ1,θ2和θ3的超参数。下面,我们说明了贝叶斯ESS在识别具有一个协变量的线性回归模型选项正态模型(如后面部分所述)为参数先验的影响提供了简单的封闭形式量化[1],许多常用的统计模型(如线性或逻辑回归)并不扩展参数先验的封闭形式表达式(宋在俊,森田聪,郭英伟等。软件X 22(2023)1013586ESS [4],并且缺乏评估先验知识对这种建模框架的影响的软件。我们提出了BayesESS,一个软件,用于量化贝叶斯分析中的参数先验的影响。R包BayesESS还附带了一个交互式Web应用程序,允许用户进一步探索参数的影响。通过视觉化的方式。对于不熟悉R编程语言的应用科学家来说,Web应用程序也可以代替R5. 结论BayesESS软件包是一个全面的开源软件,可用于量化贝叶斯分析中参数先验的影响。我们的软件的独特贡献包括:(i)能够确定需要数值估计的平凡和非平凡情况下的ESS,(ii)用于确定ESS的基于Web的应用程序,以及(iii)为临床试验中广泛使用的一些模型执行ESS估计的附加功能(见附录1、5和7)。为了提高效率,我们用C++语言扩充了BayesESS包中的一些关键函数。竞合利益作者声明,他们没有已知的竞争性财务利益或个人关系,可能会影响本文报告的工作数据可用性文章中描述的研究未使用任何数据确认JJL免责声明本出版物反映了作者的观点,不应被解释为代表FDA附录A. 补充数据与本文相关的补充材料可以在https://doi.org/10.1016/j.softx.2023.101358上找到。引用[1][10]张晓刚,张晓刚.贝叶斯数据分析。Chapman and Hall/CRC; 2014.[2]LeeJJ,Chu CT.贝叶斯临床试验在行动。Stat Med 2012;31:2955[3]贝里湾 贝叶斯临床试验。 Nat Rev2006;5:27-36.[4]Morita S,Thall PF,Müller P.确定参数先验的有效样本量。Biometrics2008;64(2):595-602.[5]Morita S,Thall PF,Müller P.评估贝叶斯生物统计学中先验假设的影响。StatBiosci2010;2:1-17.
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功