机器学习与因果推理教程:从理论到应用

版权申诉
5星 · 超过95%的资源 2 下载量 122 浏览量 更新于2024-07-02 收藏 12.81MB PDF 举报
本次课程是 Jonas Peters 在 2017 年于剑桥 MIT 的一次关于因果关系的迷你讲座,旨在介绍因果推理的基本概念、方法及其在机器学习中的应用。讲座涵盖了结构性因果模型、介入性分布、因果结构的推断以及因果概念在经典机器学习问题中的应用。 在因果关系的探讨中,首先提到了当前机器学习领域主要关注预测性能,而因果关系的理解相对滞后。因果关系的重要性在于它能解释预测为何有效,例如在基因与疾病、政策与经济指标之间的关系研究中。讲座分为四个部分: 1. **结构性因果模型与介入性分布**:这部分介绍了如何定义和计算因果效应,当因果结构已知时。结构性因果模型(Structural Causal Models, SCM)是一个用于描述变量间因果关系的数学框架,而介入性分布则描述了在对系统进行特定干预时的结果。 2. **因果结构的推断**:这里提出了三种从数据中识别因果结构的方法:(1) 检测数据中的条件独立性;(2) 限制结构方程模型;(3) 利用因果模型在不同环境下的不变性。这些方法帮助我们在没有先验知识的情况下,从观测数据中推测因果关系。 3. **因果概念在机器学习中的应用**:因果推理的概念可以被应用于更传统的机器学习任务,比如特征选择、模型解释和强化学习。通过因果推理,可以更好地理解哪些特征对模型预测有直接影响,提高模型的可解释性和稳健性。 4. **机器学习的应用**:这部分可能进一步讨论如何将因果推理技术融入到机器学习的训练、评估和优化过程中,以及它们如何帮助解决过拟合、偏差和泛化能力的问题。 讲座内容引用了众多学者的研究,包括 UCLA 的 Judea Pearl、CMU 的 Peter Spirtes 和 Clark Glymour 等,强调了因果推理在学术界和工业界的广泛影响。 这个讲座提供了一个深入理解因果关系的入门途径,对机器学习从业者和研究人员来说,了解并掌握这些知识将有助于提升他们的工作能力和理论理解。
2021-08-19 上传
【干货书】《因果推理导论-机器学习角度》,132页pdf 有几个主要的主题贯穿全书。这些主题主要是对两个不同类别的比较。当你阅读的时候,很重要的一点是你要明白书的不同部分适合什么类别,不适合什么类别。 统计与因果。即使有无限多的数据,我们有时也无法计算一些因果量。相比之下,很多统计是关于在有限样本中解决不确定性的。当给定无限数据时,没有不确定性。然而,关联,一个统计概念,不是因果关系。在因果推理方面还有更多的工作要做,即使在开始使用无限数据之后也是如此。这是激发因果推理的主要区别。我们在这一章已经做了这样的区分,并将在整本书中继续做这样的区分。 识别与评估。因果效应的识别是因果推论所独有的。这是一个有待解决的问题,即使我们有无限的数据。然而,因果推理也与传统统计和机器学习共享估计。我们将主要从识别因果效应(在第2章中,4和6)之前估计因果效应(第7章)。例外是2.5节和节4.6.2,我们进行完整的例子估计给你的整个过程是什么样子。 介入与观察。如果我们能进行干预/实验,因果效应的识别就相对容易了。这很简单,因为我们可以采取我们想要衡量因果效应的行动,并简单地衡量我们采取行动后的效果。观测数据变得更加复杂,因为数据中几乎总是引入混杂。 假设。将会有一个很大的焦点是我们用什么假设来得到我们得到的结果。每个假设都有自己的框来帮助人们注意到它。清晰的假设应该使我们很容易看到对给定的因果分析或因果模型的批评。他们希望,清晰地提出假设将导致对因果关系的更清晰的讨论。