基于RVM的软件可靠性:失效数据选择的重要性

0 下载量 61 浏览量 更新于2024-08-28 收藏 1.65MB PDF 举报
本文主要探讨了在相关向量机(RVM)软件可靠性建模中失效数据的选择策略。软件复杂性是导致可靠性问题的关键因素,传统的参数化模型在不同软件项目中的预测能力可能存在差异,因此选择一个适用于所有项目的合适模型具有挑战性。针对这一问题,研究者关注了基于核函数的软件可靠性模型,这种模型通常考虑软件失效时间数据与其之前m次失效时间数据之间的关系。 文章的核心研究集中在m值的选择上,即软件失效数据集中考虑的历史故障次数。通过对五个不同类型失效数据集进行分析,研究人员采用Mann-Kendall检验方法来评估m值变化对模型预测能力的影响。他们的发现揭示了一个重要趋势:随着m值的增加,即历史故障数据的时间跨度扩大,模型的预测能力呈现出逐渐下降的趋势。这表明,较新的失效时间数据(即现时失效时间数据)相对于更久之前的数据,在预测未来软件故障方面可能更为有效。 为了进一步确认这一点,作者将m值划分为几个区间,并通过配对T检验进行了实验研究。实验结果显示,当m的取值处于6、7、8、9、10这个范围内时,相关向量机模型能够展现出最佳的预测性能。这意味着,在实际应用中,选择近期内的失效数据作为输入特征对于建立高效、精准的软件可靠性模型至关重要。 总结来说,本文提供了关于如何在相关向量机软件可靠性建模中合理选择失效数据的重要指导,特别是在处理历史故障数据的时效性和模型预测精度之间的权衡。这对于软件开发人员优化模型选择,提高软件可靠性评估的准确性具有实际意义。