RASCH模型在CAT中的稳健性模拟研究:准确性与区分度分析

2 下载量 183 浏览量 更新于2024-09-04 收藏 373KB PDF 举报
计算机自适应测验(CAT)是一种基于项目反应理论(IRT)的创新性评估方法,它旨在提高测试效率和准确性。本文的标题《计算机自适应测验中RASCH模型稳健性的模拟研究》由邓远平和罗照盛两位作者撰写,发表于江西师范大学教育学院。RASCH模型在此研究中扮演核心角色,它是CAT中最常用的理论模型之一,用于估计个体的能力水平。 研究主要通过模拟数据,比较Rasch模型与Birnbaum模型在CAT中的性能。Rasch模型以其在不同难度水平下依然能够准确估计个体能力的特点,展现了其稳健性。作者通过计算误差均方根(RMSE)和平均差异(AD),以及能力相关的指标,来量化和分析这两种模型在CAT中的表现。结果显示,即使面对区分度不等的情况,Rasch模型的表现依然优于或至少与Birnbaum模型相当,这表明其在实际应用中的稳定性。 RASCH模型的稳健性对于确保CAT的公平性和有效性至关重要,因为它能够在处理各种能力水平的被试时提供可靠的结果。在传统纸笔测验中,固定难度的题目可能无法满足所有被试的需求,而CAT则可以根据个体能力动态调整题目,从而提高测量的精准度。此外,CAT的其他优势,如测试时间缩短、个性化评估和实时反馈,也使得它在教育评估和职业资格认证等领域得到了广泛应用。 尽管计算机化自适应测验(CAT)的发展始于美国教育服务社(ETS)的推广,但其影响力已经远远超越了最初的几个考试项目,预示着教育评估技术的革新趋势。该研究的重要意义在于,它提供了关于RASCH模型在CAT中稳定性的实证证据,这对于教育测评设计者和实践者来说,是一项关键的信息,有助于他们优化测验设计,提升测试质量。 本文通过对RASCH模型在CAT中稳健性的模拟研究,揭示了其在动态适应性测试中的核心作用,为提高教育评估的科学性和有效性提供了有力支持。