深度学习中的不确定性估计:理论与应用

5星 · 超过95%的资源 需积分: 41 21 下载量 32 浏览量 更新于2023-05-22 1 收藏 8.83MB PDF 举报
"不确定性在深度学习中的研究构成了这篇博士学位论文的核心内容。作者Yarin Gal在剑桥大学工程系进行工作,通过对深度学习模型的理论构建和发展,提出了将现代深度学习工具转化为具有实际不确定性估计的Bayesian模型的方法,而无需改变模型结构或优化过程。论文的第一部分着重于理论构建,探讨了dropout和其他随机正则化技术与近似贝叶斯模型之间的联系,并通过实证评估了这些关联。通过这些工具,论文展示了深度学习与贝叶斯建模之间的应用,例如在图像数据的主动学习和数据高效的强化学习中的实践应用。此外,论文还涵盖了语言处理、医疗诊断、生物信息学、图像处理和自动驾驶等领域中的案例研究,证明了这些技术的实用性。 论文进一步探索了深度学习与贝叶斯建模之间的深刻见解,以及这些关联对模型不确定性的决定因素。作者深入分析了线性情况下的近似推理,并理论研究了诸如spike-and-slab先验等不同类型的先验。通过这些分析,读者可以理解模型的不确定性是如何被建模和控制的。 值得注意的是,这项工作的原创性和独立性得到了强调,声明了除了明确引用他人的工作外,论文的内容都是作者独立完成,没有在其他学位或学术机构中提交过。此外,作者表达了对多位同行、导师如Christof Angermüller、Yoshua Bengio、Phil Blunsom等人在论文写作过程中提供评论和讨论的感谢。 这篇论文为深度学习领域的不确定性估计提供了一种新的视角,不仅推动了理论的发展,也促进了深度学习在众多实际场景中的应用,尤其是在需要可靠预测和解释能力的领域,如医疗和自动驾驶等。"