proportion：推断二项式比例和贝叶斯计算的全面R包

55 浏览量更新于2024-01-27 收藏 974KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

SoftwareX 6（2017）36原始软件出版物proportion：一个全面的R包，用于推断单个二项式比例和贝叶斯计算M. Subbiaha，V.拉杰斯瓦兰湾a印度泰米尔纳德邦Ponneri的L N政府学院数学系bHCL Technologies Ltd.，天气-金奈，印度graph i c ala bst ra ctar t i cl e i nf o文章历史记录：接收日期：2016年1月26日接收日期：2016年6月13日2017年1月5日接受保留字：二项比例评价准则预测分布R包a b st ra ct广泛的统计实践表明，在二项式实验中估计概率参数的推理问题的重要性和相关性，特别是在频率论，贝叶斯和Bootstrap方法的竞争区间问题上。在自由R环境中编写并在本文中呈现的包试图通过汇集许多广泛可用且性能良好的方法并在其上添加基本变体来解决刚刚强调的问题。广泛的功能可以帮助具有不同技能的用户以数字和图形的方式估计、评估、总结采用频率论或贝叶斯范式的各种度量©2017由Elsevier B.V.这是一篇CC BY-NC-ND许可下的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）的网站上进行了介绍。代码元数据当前代码版本1.2.0此代码版本使用的代码/存储库的永久链接https://github.com/ElsevierSoftwareX/SOFTX-D-16-00020法律代码许可GPL-2http://www.gnu.org/licenses/old-licenses/gpl-2.0.en.html代码版本控制系统使用git软件代码语言R编译要求，操作环境&依赖性Linux，OS X，Microsoft Windows.在R软件环境下运行。如果可用，链接到开发人员文档/手册https://cran.r-project.org/web/packages/proportion/proportion.pdf问题支持电子邮件v. gmail.com*函授：L N Government College数学系Ponneri电子邮件地址：sisufive@gmail.com（M. Subbiah）。http://dx.doi.org/10.1016/j.softx.2017.01.0012352-7110/©2017由Elsevier B. V.发布这是一篇CC BY-NC-ND许可下的开放获取文章（www.example.com/）http://creativecommons.org/licenses/by-nc-nd/4.0可在ScienceDirect上获得目录列表SoftwareX期刊主页：www.elsevier.com/locate/softxM. Subbiah，V.Rajeswaran/SoftwareX 6（2017）3637∼软件元数据当前软件版本1.2.0此版本可执行文件的永久链接https://github.com/RajeswaranV/proportion法律软件许可证GPL-2http://www.gnu.org/licenses/old-licenses/gpl-2.0.en.html计算平台/操作系统Linux，OS X，Microsoft Windows安装要求依赖关系R 3.2.0或更高版本，请访问https://cran.r-project.org/如果可用，用户手册链接-如果正式出版，请在参考列表中引用该出版物https://cran.r-project.org/web/packages/proportion/proportion.pdf问题支持电子邮件v. gmail.com1. 介绍从n个独立的Bernoulli试验序列中推断二项比例（θ）的统计推断已经引起了积极的研究讨论，并得到了广泛的应用;处理置信区间（CI）的精确推断程序在频率论（近似或精确）和贝叶斯文化（包括构造主观或信息先验）以及Bootstrap方法中相当普遍。生物统计学、流行病学和生态学等不同领域的方法和实践问题可以从大量关于不同程序、评价标准和名称详细信息Bayes因子Bayes检验，仅用于简单假设，具有logistic先验二项精确-仅Wald区间、Agresti-Coull方法、Wilson方法（无CC）;转换Wald方法，基于logit互补对数、概率单位函数、Likestival比率方法和Profile似然。贝叶斯，共轭贝塔与杰弗里斯作为默认和单侧区间的边界值。其他功能提供CP，EL，均方根值，CP图。binomSamSize主要用于样本量确定，但有两种精确和近似方法BlakerCI专门用于Blaker精确方法epiR Score CI和Bayes，带专家如覆盖概率（CP），预期长度（EL）和应用;[1患病率意见Wald，关于这个世纪之久但活跃而有趣的统计问题。特别是，在构造新方法和/或评估不同方法对稀疏数据或θ在其边界上的行为的性能方面，这个问题已经变得更加有趣。为了缓解这些问题，变换（logit，反正弦），添加伪量或连续性校正（CC）与基本近似方法;另一方面，精确的方法与各种修改，以提高性能和共轭分层贝叶斯（HB）方法使用非信息先验也可以在各种讨论中找到此外，计算设施也以非常具体的方式[3，15特别是，统计编程环境R [18]具有两个仅基于反演测试的内置函数;第一个是binom.test，其执行关于Bernoulli实验中成功概率的简单零假设的精确测试，Clopper-Pearson检验具有双侧或单侧选项，默认假设成功概率为0.5，0.95水平置信区间是默认值;第二个是道具测试，用于测试几个组中比例（成功概率）的相等性。后一个函数具有关于小n（<10）的卡方近似的警告信息，并且仅遵循Yates此外，R中很少有软件包提供类似或更多的功能;下面的表按字母顺序提供了广泛感知的软件包的快速摘要，但可能不是详尽的。prop.comb.RR一个更一般的用于使用θ的测量，但可以用于基于评分（含和不含CC）、调整后的正弦曲线、调整后的Wald、修正评分和精确值（PropCI评分、然而，许多研究在基础方法及其替代方法的选择、评价标准、简单形式和教学目的方面的要求普遍不同。这项工作设想了一个包罗万象的一揽子计划的需要和范围因此，可以注意到，尽管一些软件（开放源代码/商业）可以解决这个推理问题，但以下方面需要进一步关注：（i）包括许多估计程序及其更一般化形式的衍生变体，（ii）使用不同参数值评估程序的适当工具，（iii）超出置信区间的贝叶斯计算程序，如用于假设检验的贝叶斯因子、预测推理、后验概率和经验贝叶斯（EB）程序，以及（iv）适当的图形表示，以比较不同程序的性能。在研究、实践和教科书收录方面的广泛使用是选择构造θ CI的八种近似方法的唯一标准;考虑适当的方法来调整数据、n和成功次数XBinomial（n，θ）或采用连续性校正。精确和贝叶斯方法可能不需要这些变量，尽管像[19]这样的研究推荐边界调整贝叶斯区间。此外，最明显的Clopper-Pearson（精确）方法一个计算的灵活性，使用贝塔函数或F-分布，然而，一个通用的方法来获得CI由于确切的方法已被纳入本工作。本着同样的精神，CP和EL已被包括在内的基础上，他们在研究和实践研究的广泛存在38M. Subbiah，V.Rajeswaran/SoftwareX 6（2017）36=−===≤ ≤≥≤≤+Fig. 1.工作流程，为这个积累的包，处理各种计算工具的推理程序，涉及单一二项式比例参数。然而，与计算和呈现结果的方式有关的问题在整理该推理问题时引起了注意，因此基本上进行了适当的修改。这项工作包括两个最近的[13，20]评价标准，以表明广泛的努力。此外，还有另外两个量的总结，即像差（下 LABB 和上 UABB ）和零宽度间隔（ZWI），它们仍然是研究中的关注点，如[21]。此外，贝叶斯观点提供了范围（基于其使用，但非常有限的可用性），以包括一些重要的数量，如EB，预测密度[4]，后验概率，以及在共轭分层模型下使用贝叶斯因子的假设检验2. 软件框架本软件包的主要目的是以更全面的方式介绍θ的区间估计程序，概述如下。(i) 基于样本比例的渐近正态性和标准误的估计。(ii) 基于H0：θ θ0的反向等尾二项式检验的精确方法。(iii) 基于似然比的方法。(iv) 具有beta先验或其他合适先验的贝叶斯方法此外，还包括性能指标[3，13，20]，例如基于覆盖概率、预期长度、误差和长期功效、p-置信度和p-偏倚的总结。此外，还提供了一系列具有共轭先验的贝叶斯计算（贝叶斯因子，经验贝叶斯，后验预测计算和后验概率）图1描述了可以理解这个推理问题的方式，以便扩大计算范围;粗体表示修改现有程序，如[13]或添加新程序，如基于t分布的Wald方法[22]，这些程序不适用于更广泛的受众。构造θin-的置信区间的基本方法包括Wald（反演大样本检验，并在最大似然估计下评估标准误）、Score（反演检验，在Wilson的零假设下评估标准误）、ArcSine（基于正态分布的Wald型区间）近似sin−1（θ）），Logit（Wald型区间，基于非-log（θ/ 1θ）的mal近似）、Wald-t（基于标准点估计量的t近似的方法，当x0或n[13]时进行基本边界修改）、LR（作为θ中方程的解获得的Likewise比限值，该方程形成为样本概率下的二项式似然比的对数，部分和整个参数空间上的部分），精确（双侧 P 值为 2[ePr（ X=x）+ min{Pr（ X x）， Pr（ X> x）<}]的反转等尾二项式检验，其中概率为θ和0的空值e1）、贝叶斯（最高概率密度（HPD）和基于双尾分位数的区间，使用θ的共轭先验β（a，b））。当选择特定的显著性水平时，在两个不同的平台中进一步考虑这八种方法;一种是为所有n1个x的值，另一个对于特定的x（0Xn）。随后，算法基于添加调整因子（h）和连续性校正（c）的通用版本的必要数学评估来准备。同样，该软件包提供了精确方法中不同e值的评估和比较（e 0. 5和e1是Mid-p和θ的共轭β分布的贝叶斯程序结合了分层完全贝叶斯（相等或不同的先验参数，以反映不同的先验假设）和EB方法。所有这些程序都可以根据四个主要标准（CP、EL、p-置信度和p-偏倚[20]以及误差[13]）对其性能进行评价;根据许多适当的研究（如[3，23]及其参考文献）进行了广泛总结。仔细的研究表明，包括一个通用的蒙特卡罗（MC）方法来反映参数θ的评估空间;即β分布（均匀是一种特殊情况）已被包括在适当的评估度量中，以便研究人员可以在[0，1]中选择不同形状的θ此外，函数可用于评估基于MC方法或离散形式θ的任何其他方法（例如[9，11]和[24]）得出的区间在检验涉及θ的假设的情况下，对于所有可能的组合（包括θ θ1与θ θ2），仅考虑贝叶斯因子，并且在经典框架中，双侧置信区间和假设检验之间的对偶性排除了在该软件包中添加额外的功能。此外，利用β-二项式模型的后验分布，包括在贝叶斯工具箱中;新数据模型Xnew（m，θ）的预测密度和涉及后验θ/X的概率。3. 说明性实例本节重点介绍了该软件包在特定功能、具有理论或应用重要性的数值/图形输出方面的几个突出特点;软件包中的功能然而，小插曲包括更多的插图，从文献和可能的详细分析。表1概述了二项比例（θ）的不同推理方法和计算工具;本文件的补充材料（见附录A）提供了有关输入变量、函数名称和示例的更多解释性介绍，以说明其应用。M. Subbiah，V.Rajeswaran/SoftwareX 6（2017）3639=--+===-=-= −=-图二.使用基础方法和调整方法获得的置信区间的比较。表1图三.使用精确和调整Wald方法获得的预期长度的比较。实施例2提供了EL总和的扩展图形输出。R-软件包中提供的关于单项二项式比例的各种推断量的可用计算工具。过程数值输出图形输出近似精确贝叶斯CIA、B、CBHB、EBA、B、C、HBCPA、B、CBHBA、B、C、HBElA、B、CBHBA、B、C、HB对氯苯A、B、CBHBA、B、C、HB儿A、B、CBHBA、B、C、HBBTBNANAHBNIp-CB：p-置信度和p-偏倚，ER：误差相关，BTB：贝叶斯工具箱，A：调整后，B：基础，C：连续性校正方法，NA：不适用，NI：目前未纳入示例1提供了Wald方法的基本总结，其中n5和显著性水平（α）0的情况。05，aB1，t10的情况。93,t 2 0。97;表2是从三个不同的函数（ciWD（n，alp），covpWD（n，alp，a，b，t1，t2）和lengthWD（n，alp，a，b））中提取的，后面是图形输出（图2）。 2）比较PlotciAll（n，alp）和PlotciAAll（n，alp）的六种基本方法。表2与Wald方法相关的三个函数的数值输出（n=5和α= 0）。05.精确方法中e的不同选择的三色图（PlotlengthEX（n，alp，e，a，b））和n的调整Wald（Agresti-Coull）方法的EL图5和α0的情况。05使用PlotexplAWD（n，alp，h，a，b）（见图11）。 3）。示例3说明了Clop-per-Pearson（n）的误差计算[13]。5，α0的情况。05，θ0 的情况。05，f2），提供了数值总结，表示标称误差（α）和实际误差（2.74）之间的差异，n1个间期中导致误差的病例百分比（66.67），以及误差率是否在规定范围内的指标（成功）。还可以执行图形比较（图4）（PloterrCAll（n，alp，phi，c，f）），例如n 50，c 0的CC基础方法。01保留αθ和f。同时给出了贝叶斯方法的p-置信度和p-偏差5 和α 0。05至PlotpCOpBIBA（ n， alp，a1， a2）。示例4说明了两个程序，一个是获得n的CI限值，5和α0的情况。05使用EB（empericalBA（n，alp，sL，sU））其次，基于10000个离散θ值，通过将基于分位数的区间限值插入函数co vpGEN（n，LL，UL，alp，hp，t1，t2）中来找到CP汇总;六个数值结果为 0.8762 ， 0.0000 ， 0.1221 ， 0.0973 ， 0.8816 ，27.2573，类似于表2。程序XLWDUWDLABBUABBZwi置信区间00.00000.0000没有没有是的10.00000.5506是的没有没有20.00000.8294是的没有没有30.17061.0000没有是的没有40.44941.0000没有是的没有51.00001.0000没有没有是的覆盖概率mcpWmicpWRMSE_NRMSE_MRMSE_MITol0.63880.00000.40030.25180.68669.4800预期长度SumLenexplMeanexplSDexplMaxexplLLexplUL2.76000.46240.20600.69040.05040.8744mcp：平均CP，micp：最小CP，RMSE：标称值（N）、最大值（M）和最小值（MI）的均方根估计值，Tol：CP位于规定值之间的百分比，SumLen：长度总和，explMean：平均EL，explSD：EL的标准差，explMax：最大EL，explLL：平均-SD，explUL：平均+SD。40M. Subbiah，V.Rajeswaran/SoftwareX 6（2017）36=-==-=×见图4。比较Clopper-Pearson方法和使用贝叶斯方法的p-置信度和p-偏倚的误差计算最后，示例5致力于贝叶斯计算（i）12个函数之一（hypotestBAF6 x（x，n，th1，a1，b1，th2，a2，b2））产生用于测试θ 0th 1 0的贝叶斯因子（7.7928）<。5 vs.θ1>th20的情况。9，n9，x 6，先验beta参数为（1，1）和（0.5，0.5）。（ii）n5和m 4的预测密度与Jeffreys先验的Beta（ a1，a 2）和相应的结果，probPRE（n，m，a1，a 2）以表格形式表示xnew/x01234500.75370.39900.18620.07160.01950.002210.17730.31920.28650.18230.07810.013620.05320.18420.27340.27340.18420.053230.01360.07810.18230.28650.31920.177340.00220.01950.07160.18620.39900.75374. 结论Newcombe和Nurminen [21]的主要观察之一这些活动将得到计算平台的补充，这些平台将巩固广泛适用的方法，并扩大规模，以扩大未来的研究。包中涉及的核心问题在开发新程序[9，25，26]和扩展到不同的应用领域[27]方面具有持久的研究兴趣。随后，研究人员可以使用该软件包评估，展示和增强方法，该软件包的小插曲很少有值得注意的研究，可能会进行扩展分析和展示，以便更好地理解和解释结果。许多作者经常表示，需要在教科书和教学法中采用先进的方法，这在这一基本的有趣问题中很普遍，目前的工作预计将发挥更大的作用。很少有在线计算器，如https://www.measuringu.com/wald.htm，试图扩大这一领域的研究，实践和教学实践;该软件包还增加了并铺平了方向，以增加伯努利类型事件及其关联，如差异，比例比的访问。这种有趣的研究问题的理论和实践影响提供了理解的范围内获得置信区间和重要的度量评估它们的方法学。作为示例，这种设想的包装可以具有CC的任何值、调整因子并且不免除中间值、置换测试中的任何常数包括仔细观察关于θ的研究成果需要一个集体计算环境来解决广泛研究中出现的问题，包括理论兴趣和应用。毫无疑问，在CP和EL方面专门针对精确方法改进性能的进一步研究是可见的[11，26]，因此整理精确方法是其中之一。进一步的扩展;该软件包的另一个可行的扩展可以是使用诸如引导的方法来获得CI，尽管该软件包可以适应通过任何方法获得的CI限制的评估。确认作者要感谢匿名审稿人的宝贵建议和建设性意见，大大有助于提高本文的质量附录A. 补充材料与本文相关的补充材料可以在http://dx.doi.org/10.1016/j.softx.2017.01.001上找到。引用[1] Newcombe RG.比例置信区间的位置度量。Comm Statistist Theory Methods2011;40：1743-67.[2] 苏比亚·M 2中稀疏性的贝叶斯推断2列联表及其应用论文]。Chennai：University of Madras;2008.[3] PiresAM ， Amado C. 二项比例的区间估计：二十种方法的比较。REVSTAT2008;6：165-97。[4] 杨伟，王伟，王伟. 贝叶斯-拉普拉斯，杰弗里斯和其他先验的比较：零事件的情况。Amer Statist2008;62：40-4.[5] Reed III J.二项式置信区间的振荡现象。InternetJ Epidemiol 2009;8：1.[6] Newcombe RG.前哨淋巴结活检临床试验中假阴性率的贝叶斯估计。统计医学2007;15：3429-42。[7] 魏瑜，徐国，王立宣。一个改进的评分区间与修改中点的二项式比例。《统计与计算机模拟杂志》， 2012年;84：1-17。[8] 萨默维尔MC，布朗RS。二项比例的精确似然比和评分置信区间。药学统计2013;12：120-8.[9] 放大图片作者：王栋梁. 一个二项比例和两个比例之差的平滑Bootstrap置信区间。 J Appl Stat 2013;40：614-25.[10] [10]杨晓波，王晓波.使用专家意见研究金奈沿海小型底栖动物种群-贝叶斯观点。J Environ Stat2013;4：7.[11] 图林·M二项比例的覆盖率调整置信区间。Scand J Stat2014;41：291-300.M. Subbiah，V.Rajeswaran/SoftwareX 6（2017）3641[12] Lecoutre B，Poitevineau J.计算通常的单参数离散分布的Blaker精确置信区间极限的新结果CommStatistSimulationComput2014;http://dx.doi.org/10.1080/03610918.2014.911900.[13] MartínAndrésA，Álvarez Hernández M. 比例的双尾渐近推论。J Appl Stat2014;41：1516-29.[14] Martín Andrés A，Álvarez Hernández M.评论“一个改进的评分区间与修改中点的二项式比例”。JStatComputSimul2015;1-8.http://dx.doi.org/10.1080/00949655.2015.1015128网站。[15] Pires AM.二项比例的置信区间：方法和软件评估的比较。见：ComStat会议记录，2002年。[16] Pradhan Vivek，Evans John C，Banerjee Tathagata.检验非劣效性或优效性的二项置信区间：一个从业者的困境。 Stat Methods Med Res2013;1http://dx.doi.org/10.1177/0962280213498324[17] 罗斯TD。二项比例和泊松率估计的精确置信区间。计算机生物医学2003;33：509-31.[18] R开发核心团队（）。R：统计语言和环境计算的R统计计算基金会，奥地利维也纳，2008年;www.R-project.org。[19] BrownLD，Cai TT. 达斯古普塔A.二项比例的区间估计 Stat Sci 2001;16：101-33.[20] VosPW，Hudson S. 离散置信区间的评价标准：超越范围和长度。Amer Statist 2005;59：137[21] Newcombe RG，Nurminen MN.为比例及其差异的评分区间辩护。CommStatistist Theory Methods2011;40：1271-82.[22] 潘西一个比例和两个比例之差的近似置信区间。计算机统计数据分析2002;40：143-57.[23] Reiczigel J.二项式参数的置信区间：一些新的考虑。统计医学2003;22：611-21.[24] 作者：LewisJr，Sauro J. 当100%真的不是 100 % 时：提高完成率的小样本估计数。J Usability Stud 2006;3：136[25] 达姆加德C法约尔生态学研究中小样本不平衡样本量的生存率估计：另一种贝叶斯点估计。 Comput Ecol Softw2011;1：218-23.[26] 王伟比例置信区间的迭代构造。国家主义者。Sinica 2014;24：1389-410.[27] DamgaardC，Fayolle A. 生态学研究中存活率的估算小不平衡样本量：一个替代贝叶斯点估计。Comput Ecol Softw2011;1：218-23.

下载后可阅读完整内容，剩余1页未读，立即下载