解锁机器学习模型可解释性：深度探讨与实践经验

版权申诉

109 浏览量更新于2024-03-09 收藏 1.43MB PDF 举报

本文是对机器学习模型可解释性的研究和探讨，这一领域在近两年的科研会议上成为关注热点。在过去，研究者们往往只注重模型的效果，在乎结果而忽略了过程。然而，现在不仅仅满足于模型的效果，更加注重对模型效果的原因产生更多的思考。这种思考有助于模型和特征的优化，更能够帮助更好地理解模型本身并提升模型服务质量。机器学习研究领域就像是炼丹，通过大量的灵材使使用丹炉将其凝炼成丹。类似地，模型训练就是炼丹，通过精选原始数据，按照神经网络的规定法则通过计算框架提炼，从而得到一个远小于数据数倍的模型。因为从根本原理上无从指导，穷举实验成了大多数机器学习、深度学习研究的主要研究方法，列一个参数矩阵就开始grid-search了。这种低效的方法限制了算法工程师们的发挥，然而，模型可解释性的研究则有望突破这一局限性。为了更好地理解模型的工作原理，人们开始研究模型的可解释性，即模型生成结果的过程和原因。这有助于更好地理解模型本身，并且有助于提升模型服务的质量。在这一背景下，机器学习模型可解释性成为研究的热点之一。本文对相关资料进行了汇总，对机器学习模型可解释性进行了综述。模型可解释性的研究对于机器学习业务应用具有重要意义。在机器学习业务应用中，输出决策判断是目标。可解释性的研究有助于理解模型的决策过程，从而使决策更具合理性和可信度。此外，可解释性研究还有助于发现模型中的潜在问题和缺陷，进而优化模型和特征，提升模型的性能和效果。在机器学习模型可解释性的研究中，有几个方面值得重点关注。首先，模型可解释性的研究可以帮助人们更好地理解模型的决策过程。通过分析模型生成结果的过程和原因，可以揭示模型的内在工作机制，从而加深人们对模型的理解。其次，模型可解释性的研究有助于发现模型中的潜在问题和缺陷。通过分析模型生成结果的过程和原因，人们可以发现模型中可能存在的偏差、错误和不合理之处，进而优化模型和特征，提升模型的性能和效果。最后，模型可解释性的研究还有助于增强模型的可信度和可靠性。通过揭示模型生成结果的过程和原因，可以使模型的决策更具有合理性和可信度，从而增强人们对模型的信任和依赖。在对机器学习模型可解释性的研究中，人们通常采用的方法包括解释模型的预测结果、解释模型的内在工作机制、解释模型中的特征重要性等。在解释模型的预测结果方面，人们试图理解模型生成特定决策的过程和原因，从而揭示模型的工作机制。在解释模型的内在工作机制方面，人们试图分析模型的结构和参数，以揭示模型的内在运行规律。在解释模型中的特征重要性方面，人们试图分析模型对不同特征的重视程度，以揭示模型对不同特征的利用情况。总之，机器学习模型可解释性的研究对于机器学习在业务应用中的发展具有重要意义。通过分析模型生成结果的过程和原因，人们可以更好地理解模型的决策过程，发现模型中的潜在问题和缺陷，增强模型的可信度和可靠性，从而提升模型服务的质量。希望本文对机器学习模型可解释性的研究能够对相关领域的进一步发展有所促进。

全局可解释：就是试图理解“模型如何进⾏预测？”和“模型的⼦集如何影响模型决策？”。要⽴即理解和解释整个模型，

我们需要全局可解释性。全局可解释性是指能够基于完整数据集上的依赖（响应）变量和独⽴（预测变量）特征之间

的条件交互来解释和理解模型决策。尝试理解特征交互和重要性始终是理解全球解释的⼀个很好的⼀步。当然，在尝

试分析交互时，在超过两维或三维之后可视化特征变得⾮常困难。因此，经常查看可能影响全局知识模型预测的模块

化部分和特征⼦集会有所帮助。全局解释需要完整的模型结构，假设和约束知识。

局部解释：试图理解“为什么模型为单个实例做出具体决策？”和“为什么模型为⼀组实例做出具体决策？”。对于本地可

解释性，我们不关⼼模型的固有结构或假设，我们将其视为⿊盒⼦。为了理解单个数据点的预测决策，我们专注于该

数据点并查看该点周围的特征空间中的局部⼦区域，并尝试基于该局部区域理解该点的模型决策。本地数据分布和特

征空间可能表现完全不同，并提供更准确的解释⽽不是全局解释。局部可解释模型 - 不可知解释（LIME）框架是⼀种

很好的⽅法，可⽤于模型不可知的局部解释。我们可以结合使⽤全局和局部解释来解释⼀组实例的模型决策。

模型透明度：为试图理解“如何根据算法和特征创建模型？”。我们知道，通常机器学习模型都是在数据特征之上利⽤算

法来构建将输⼊映射到潜在输出（响应）的表⽰。模型的透明度可能试图了解模型的构建⽅式以及可能影响其决策的

更多技术细节。这可以是神经⽹络的权重，CNN滤波器的权重，线性模型系数，决策树的节点和分裂。但是，由于业

务可能不太精通这些技术细节，因此尝试使⽤不可知的局部和全局解释⽅法来解释模型决策有助于展⽰模型透明度。

可解释性的作⽤

对于想要了解模型如何⼯作的数据科学家来说，评估模型的准确性通常是不够的。数据科学家通常想知道模型输⼊变

量如何⼯作以及模型的预测如何根据输⼊变量的值⽽变化。

机器学习算法和模型的⼯程应⽤中⽤到最多的主要是树类模型(lgb,xgb)和神经⽹络(cnn, rnn)，使⽤者往往习惯于很少

去思考其中的含义和解释性。需要思考⼀个模型的哪些东西是可解释的？

所以有⼏个问题值得讨论：

哪些特征在模型看到是最重要的？

关于某⼀条记录的预测，每⼀个特征是如何影响到最终的预测结果的？

从⼤量的记录整体来考虑，每⼀个特征如何影响模型的预测的？

为什么这些解释信息是有价值的呢：

调试模型⽤

⼀般的真实业务场景会有很多不可信赖的，没有组织好的脏数据。你在预处理数据时就有可能加进来了潜在的错

误，或者不⼩⼼泄露了预测⽬标的信息等，考虑各种潜在的灾难性后果，debug的思路就尤其重要了。当你遇到了

⽤现有业务知识⽆法解释的数据的时候，了解模型预测的模式，可以帮助你快速定位问题。

指导⼯程师做特征⼯程

特征⼯程通常是提升模型准确率最有效的⽅法。特征⼯程通常涉及到到反复的操作原始数据(或者之前的简单特

征)，⽤不同的⽅法来得到新的特征。有时候你完成FE的过程只⽤到了⾃⼰的直觉。这其实还不够，当你有上百个原

始特征的时候，或者当你缺乏业务背景知识的时候，你将会需要更多的指导⽅向。如何创造出这样优秀的特征呢？

如何找到最重要的特征的⽅法，并且可以发现两个特别相关的特征，当⾯对越来越多的特征的时候，这些⽅法就会

剩余21页未读，继续阅读

普通网友

粉丝: 1263
资源:
5619

解锁机器学习模型可解释性：深度探讨与实践经验

解释：适合可解释的模型。 讲解黑匣子机器学习

深度学习的可解释性.pdf

深度学习可解释性研究进展.pdf

机器学习的可解释性.pdf

基于LIME的改进机器学习可解释性方法.pdf

图机器学习峰会-6-5 基于图的视觉分类模型的可解释性.pdf

机器学习的可解释性综述.pdf

机器学习模型可解释性方法、应用与安全研究综述.pdf

预训练语言模型实体匹配的可解释性.pdf

机器学习和向机器学习.pdf

最新资源

解释：适合可解释的模型。讲解黑匣子机器学习