基于关系学习和推理的可解释分类与注释

182 浏览量更新于2023-12-03 收藏 5.26MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

基于关系学习和推理里吉斯·皮耶拉尔引用此版本：瑞吉斯·皮耶拉德通过关系学习和推理可解释的分类和注释人工智能[cs.AI]。巴黎-萨克雷大学，2020年。英语NNT：2020UPAST 008。电话：03115438HAL Id：tel-03115438https://theses.hal.science/tel-031154382021年1月19日提交HAL是一个多学科的开放获取档案馆，用于存放和传播科学研究文件，无论它们是否已这些文件可能来自法国或国外的教学和研究机构，或来自公共或私人研究中心。L’archive ouverte pluridisciplinaire博士论文NNT：2020UPAST008基于关系学习和推理的可解释分类与注释巴黎萨克雷大学博士论文École doctoralen 573，Interfaces：approches interdisciplinaires，基础、应用和创新Spécialité de doctorat：Informatique Unité de recherche：Université Paris-Saclay，CentraleSupélec，Mathématiques et Informatique pour la Complexité et les Systèmes，91190，Gif-sur-Yvette，France.联系人：中央高等学校Thèse présentée et soutenue à Gif-sur-Yvette，le 15 septembre 2020，par雷吉斯·皮拉尔陪审团组成乌格斯·塔尔博特总统高等教育学院Freddy Lecue特别报告员和审查员Directeur de recherche，Thales/INRIAYann Chevaleyre巴黎第九大学大学讲师特别报告员兼考官伊莎贝尔·布洛赫巴黎大学电视台Céline HudelotDirectrice高等教育学院让-菲利普·波利·恩卡德朗原子能和替代能源委员会研究工程师Laurent CabaretInvitéAgrégé律师，中央高等法院iii确认这篇论文是一次非同寻常的冒险，我想感谢所有使它成为可能的人。首先，我要感谢陪审团的所有成员，感谢他们花时间来评估我的工作，感谢他们在我们因为特殊的卫生环境而不得不两次推迟辩护时的耐心。我真诚地认为导师对论文的进展和博士生的整体经历有很大的影响。我很幸运地被那些能够在需要的时候激励和推动我的人所因此，我非常感谢我在CEA的导师Jean-Philippe，当我有问题或问题时，他总是可以帮助我，并为我提供了多个建议来形成这篇论文。我还要特别感谢我的论文指导人Céline Hudelot，感谢他一直以来对我的支持，感谢他在我需要的时候愿意与我见面和交谈。Jean-Philippe和Céline总是努力让我处于最佳状态来完成我的论文，对此我非常感激。本手稿中的部分工作是与CentraleSupélec教授Laurent Cabaret合作的结果。他帮助我处理我所知甚少的科学限制。我真的很感激与他一起工作，我要感谢他的可用性和他花时间审查这项工作的一部分。我还要感谢Isabelle Bloch同意参加并审阅我的论文答辩，以及在我研究模糊膨胀算子时给予的合作。当我到达LADIS实验室时，我受到了热烈的欢迎，我在那里遇到的人也帮助我度过了整个经历。我感谢中午吃饭的人，感谢所有每周三下班后踢足球的人我很高兴每周的足球训练已经成为一种习惯，我期待着再次参加比赛特别是，我要感谢桑德拉，感谢她为我们提供的许多早餐和会谈，感谢她给我的提示，感谢她提出的所有活动;感谢文森特，感谢我们在办公室里花了无数个小时谈论每一个可能的话题;感谢阿诺德，感谢他对词源的热爱，感谢我们一起在西班牙和巴西参加会议的两次伟大旅行;感谢伊斯梅尔，感谢我们进行的伟大的技术和体育会谈。我还要感谢希瓦尼、安德烈、巴蒂斯特、洪、埃德温、艾蒂安、梅里特塞尔、拉斐尔、米卡尔和哈里。最后，我想强调我的家庭的作用我对父母的支持感激不尽，他们总是鼓励我尽我所能，给我所需的我也感谢我的哥哥和奶奶，他们一直在我身边，一直相信自己。v内容鸣谢三介绍1AI5中的可解释性1可解释的人工智能71.1关于可解释性和可解释性定义1.2Taxonomy111.3相关作品131.4评价修正案321.5广告对用户361.6讨论. 372建议的方法392.1什么解释？...........................................................................................................392.2哪个型号？...........................................................................................................402.3哪些功能？...........................................................................................................402.4总体思路41第二章建立一个可解释的模型453模型表达性和模糊关系493.1模型的表现力493.2模糊关系513.3讨论544学习相关关系和描述符554.1基于XML的描述符554.2频繁项集挖掘564.3模糊频繁项集挖掘4.4模糊关闭算法624.5讨论685防止冗余评估方法715.1暴力关系评估725.2在线修剪不常见关系725.3基于知识的关系745.4讨论84vi6生成用于执行可解释分类的规则或约束或注释876.1建筑物分类876.2将关系转换为注释91的约束6.3从规则和约束956.4讨论.98第三章空间和时间推理1017空间与时间1057.1模糊空间关系1057.2时间关系1147.3时空关系1157.4讨论1168快速并行模糊形态算子1178.1模糊扩张1188.2相关算法1188.3矢量化多线程反向算法1238.4基准和结果1268.5讨论1308.6鸣谢1309图像实验1319.1用于图像分类的1319.2医学图像中的器官注释1409.3讨论15110 应用于时间序列分类15310.1 数据集15310.2 关系词汇15510.3 讨论160结论与展望163A出版物169A.1 国际同行评审会议169A.2 国家同行评审会议169B模糊逻辑：主要定义B.1模糊集171B.2语言变量172B.3模糊关系172B.4模糊运算符172C 关闭操作员175C.1定义175C.2证据175D 模糊关闭算法：实验结果179D.1 数据集179D.2 讨论与讨论179viiE拓扑排序181E.1定义181E.2实施例181E.3算法182F其他结果183F.1器官注释实验183F.2时间序列分类：语言变量184G SIMD185G.1 建筑学185G.2 指示186H Résumé en français参考书目189ix图目录1.1狗分类的例子（Simonyan等人， 2013年，它解释了解释和解释之间的区别。在左边，显着图是一种解释，因为它相对容易理解给定的输入，但它没有描述导致分类的逻辑。在右边，这是一个解释的例子，因为原因已清楚说明。...............................................................................................111.2来自（Laugel等人，2019年）。在Iris数据集上训练了两个分类器，该数据集包含三个不同的类。它们在测试集上的准确率都是78%。在图1.2A中，随机森林对特征空间进行了一些有问题的划分，因为它对离群值很敏感。在图1.2B中，远离训练数据的SVM决策似乎也不可靠。在这些情况下，事后的可预测性可能会产生看似合理但误导性的解释。...........................................131.3来自（Lakkaraju et al.，2016年）。因为它是一个决策集，所以规则是相互独立的。规则的长度和每类规则的数量都不高，这使得结果可以理解，推理清晰...................................................................................................................151.4用于评估一个人可以佩戴哪种镜片的决策树示例。导致每个类的推理是清晰的，树的浅度使模型易于解释。这个例子摘自Bhiksha Raj教授的决策树课程卡内基梅隆大学161.5使用线性回归作为可解释模型的示例（Poursabzi-Sangdeh等人，2018年）。目标是预测纽约市某个街区的公寓价格，给出八个不同的特征。对应于每个特征的系数为用户提供了一个他们在最终结果中扮演的角色。.......................................................................171.6示例显示如何使用kNN来解释预测（Kenny和Keane，2019）。要分类的实例为“6”，但系统返回“0”。kNN使得能够理解系统已经被属于类“0”的一些训练实例误导。但看起来像“6”.....................................................................................................191.7自我解释神经网络的整体架构（AlvarezMelis和Jaakkola，2018）。有一个参数化器（橙色）生成对应于β的相关性得分。然后，使用编码器（绿色）从输入空间的原始特征中学习更高级别的概念，这些特征对应于h。最后，一个聚合层使得能够定义g，并得到一个解释，作为一组夫妇系数/概念。........................................................................................................ 20xⓍⓍCL1.8自我解释网络（Al-varez Melis和Jaakkola，2018）在MNIST数据集上产生的解释示例。已经学习了五个概念，并且针对两个不同的输入示出了它们对应的系数。对于每一个概念，最具代表性的是-显示数据集中的站。...........................................................................................201.9由（Li et al.，2018年）。使用编码器将输入投影到潜在空间中，以便它们可以与学习的原型相匹配。解码器可以看到-把这些原型化。...................................................................................................211.10 示例来自（Alonso和Bugarín，2019）。我们的目标是预测，如果在电话营销，消费者订阅定期存款。这由变量Bank表示，它可以接受两个值：“yes”或“no”。在这里，导致预测的分支被突出显示（绿色），并生成自然语言的解释。我们可以看到，关于特征pdays和euribor3m的分裂准则是：以语言学术语“低”为特征。...............................................................................221.11 导致图像最大化单个神经元激活的优化过程（Olah等人， 2017年）。初始图像已被随机噪声填充。在这个过程的最后，我们可以看到激活神经元最多的模式类型。在这种特定情况下，使激活最大化的图像表示规则模式，这似乎是一个纹理。...........................................................................................241.12 通过在MNIST数据集上蒸馏教师神经网络获得的软决策树示例（Frosst和Hinton，2017）。每个节点处的图像是过滤器，其被学习以定义用于分裂实例子集的概率分布。在每个节点和每个叶子上最可能的分类在树...........................................................................................................................251.13 在MNIST数据集上学习的一组原型和一组批评（Kim等人， 2016年）。我们可以看到，原型看起来更像是人类所期望的手写数字，而不是关键字。cisms。.................................................................................................................251.14 该图表示关于特征F1的预测的个体条件期望（Goldstein等人，2015年）。我们可以看到，估计量y ∈ F和F1之间存在抛物线关系。点对应于每个实例的F1的实际值。黄线是部分依赖图，它是ICE在所有情况下。............................................................................................ 271.15 在（Kim等人，2018年）。在a中，用户提供一组表示概念的示例（这里是“条纹“）和一组随机示例。在Zerob中，提供了与所研究的类（这里是zebras）相对应的训练实例。在c中，f l是输入实例到对应于层l的潜在空间中的投影，并且hl，k是分类器r。在Escherd中，概念激活通过训练线性分类器来学习向量v1，以区分由概念的例子产生的激活和由其他例子产生的激活。最后，在图中，通过在vC方向上相对于fl（x）导出hl，k来计算概念敏感度。 . 28xiK--1.16 在（Hendricks等人， 2016）提取视觉特征并预测类别标签。然后，句子生成由视觉特征和类标签条件，以得到一个区分，创造性和描述性解释。.......................................................................................291.17 说明石灰和石灰的原理。...................................................................................311.18 模型的架构见（Lécué和Pommellet，2019）。对象检测模型被训练并应用于图像。具体地，从数据集中的每种类型的对象的知识图中提取上下文信息。根据该上下文信息与图像中其他对象的预测之间的一致性，模型输出的置信度会增加或不. .....................................................................................................................331.19 来自（Hendricks等人， 2016），其呈现了不一定是类相关的图像描述与不一定是图像相关的类定义之间的差异。直观的解释应该依赖于也存在于研究35中2.1本论文中提出的用于执行IM的方法的说明。年龄注释。...........................................................................................................423.1代表语言变量的图形（“duration”，[ 0; 100 ]，F short，F long）。两个模糊集F短和F长的隶属函数分别用蓝色和红色表示。F短的核心是[0; 25]而Flong的核是[75; 100]533.2正方形左边的圆的关系不能用同样的方法表示的两个图形。模糊逻辑提供的工具，以不同的特点，这两种情况下，依赖于相同的模糊关系54的左边5.1曲线表示B=n（S-1）+1随评估样本数k的演变，样本总数n= 30。为了清楚起见，仅显示B的正值（如果B为负，则不能丢弃任何支持，因为它始终为正，或者null）。................................................................................................................745.2标签有向图的示例。顶点是关系，顶点之间的有向边根据关系之间的链接进行标记。对于每条边，其对应的标签在其右侧。805.3我们使用算法3得到的有向无环图的例子图5.2所示的知识图827.1代表RCC8的8个核心关系的图片：DC（断开）、EC（外部连接）、PO（部分重叠）、EQ（相等）、TPP（切向部分）、NTPP（非切向部分）、TPPi（切向部分逆）和NTPPi（非切向部分部分反相）（Randell等人， 1992年）。...................................................... 1067.2一个模糊扩张的例子。图7.2B表示与红色物体的模糊变化相关的模糊景观，ing图7.2A7.3距离关系“近”和“远”的示例。.........................................................................1107.4表示“之间“的关系的模糊景观的示例两个红色物体（Cinbis和Aksoy，2007）。..................................................111xii×××∈U×××××7.5示例来自（Vanegas，2011）。......................................................................1117.6两个对象之间的缠绕的示例（Clément等人， 2017年）。..........................1137.7通过（Colliot，2003）114中描述的方法找到的对称轴7.8模糊时间范围的示例（Poli等人， 2018年）。.............................................1168.1通过结构元素SE对参考对象F的模糊扩张D SE（F）。这里表示的空间关系是D ν（μ）的每个像素的强度表示其验证关系的程度。结构元素的图像是另外两个是因为它是执行扩张所需要的。.....................................................1188.2对于模糊膨胀的每次迭代，DSE（F）（u），其中u，结构元素SE在输入图像F上循环。如图所示在这两个图上，SE需要大于F以完全覆盖它。1198.3用朴素算法和Bloch方法生成的模糊景观的比较。.......................................1228.4计算模糊膨胀的朴素算法和逆向算法的比较。输入图像有384行。虽然朴素方法逐个像素地计算膨胀，但是相反的方法仅计算参考对象中的非零像素的贡献。在行33上，参考对象的第一个非零像素在图上几乎不可见，并且被红色椭圆包围。一旦引用对象被完全循环（行170），反向算法完成并返回与朴素算法相同的结果。从第384排开始。...............................................................................................1248.5对参考对象（左侧）的一个活动像素（红色）的模糊膨胀的贡献。为了便于说明，仅表示了4个线程和128列。PR是反向算法的多线程版本，其中每个线程负责模糊膨胀D ν（μ）的一条行。对于PR128、PR256和PR512，对于每个线程，使用AVX、AVX2和AVX512分别1268.6人工数据集样本：a）矩形，b）圆盘，c）椭圆形，d）256256具有256个有效像素的清晰正方形，e）256 256具有4096个有效像素的清晰正方形，f）256 256具有65536个有效像素的清晰正方形，g）具有256个有效像素的256 256模糊正方形，h）具有4096个有效像素的256 256模糊正方形，i）具有65536个有效像素的256 256模糊正方形，j）具有65536个有效像素的512 512清晰正方形，k）10241024清晰的正方形与65536有效像素...................................................1278.7自然图像数据集的执行时间分布。.................................................................1309.1第9.1节解释分类示例中使用的数据集每个类别的示例1329.2如何在实例中计算特定关系的示例。这里，目标是计算圆盘右侧的关系椭圆。给定一个实例（图9.2 A），提取出磁盘，它是关系中要评估的参考对象（图9.2 B）。然后就可以计算出圆盘右边的模糊地形（图9.2C）。最后，如第7章所解释的，可以使用模糊模式匹配方法.....................................................................................................133xiiiR R9.3使用（Chanussotet al.， 2005年）。对于椭圆的每个阿尔法切割，提取其边缘，并计算该边缘的每个点到椭圆的质心的距离。因此，我们为每个alpha cut得到一个形状签名。最后，通过对上一步得到的所有签名进行平均，得到最终签名。在这里，我们可以看到有两个相同值的最大值和两个最小值。此外，这些极值是一致的蔓延到边缘。该签名是典型的椭圆。.............................................................1349.4表示词汇中关系之间的逻辑联系的图。有三个子图只有一种边：e，代表着12135........................................................................9.5显示模型性能相对于最小支持值的图。我们在0.5到0.65之间达到了100%的准确度。红色虚线表示规则中的关系在从其他类的公共关系中删除之前的平均数量。红色的普通线对应于从普通关系中剔除。.........................................................................................1369.6说明类1中的实例的示例关系用粗体因为它们被其他类的规则共享。.....................................................................1389.7说明类2中的实例的示例。这是我们生成的边界示例之一。粗体的关系被删除因为它们被其他类的规则共享。.....................................................................1389.83类实例的解释示例关系用粗体因为它们被其他类的规则共享。.....................................................................1399.9说明类4中的实例的示例。这是我们生成的边界示例之一。粗体的关系被删除因为它们被其他类的规则共享。.....................................................................1399.10 数据集中四种扫描类型的示例。.....................................................................1409.11 在这个实验中，我们考虑这个图中的9个彩色器官。1419.12 肝脏左侧关系（第142页图9.12A）和完全关系对应的模糊景观比较肝脏左侧（第142页图9.12B）。..................................................................... 1429.13 对称性度量的例子。.........................................................................................1429.14 处理的关系之间的逻辑链接的图这个实验中的模型。.........................................................................................1429.15 解释注释的示例。.............................................................................................1459.16 回答前四个问题。.............................................................................................1499.17 回答最后四个问题。.........................................................................................15010.1 从我们工作的时间序列数据集的例子。.........................................................15410.2 第4类中的三个例子，乍一看并不具有相同的性质。这就是我们在日常生活中在类4的实例中。...............................................................................................15410.3 1类中的时间序列示例这8个信号已被平滑并已被执行分割。垂直黑线表示第一段之间的边界，对应于瞬态状态，第二段对应于稳态。.............................................................................15510.4 表示时间序列分类实验关系之间逻辑链接的图形。.....................................15610.5 说明类1中的实例的示例。...............................................................................15710.6 说明类2中的实例的示例。...............................................................................157xiv10.7 3类实例的解释示例。.......................................................................................15810.8 5类中的实例的解释示例。...............................................................................15810.9 混淆矩阵显示了我们的模型在时间序列分类实验.............................................................................................15910.10给定一幅输入图像，我们可以得到一个方便的分割，通过在过分割上应用分层聚类来识别感兴趣的实体。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .166D.1 显示数据库通过次数相对于三个数据集的最小支持阈值的图。 . . . . . . . . . . . . . .180E.1拓扑排序的有向无环图示例。. . . . . . .182F.1模糊集对应的语言变量的增加和减少。. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .184F.2对应于语言变量的模糊集变化。 . . . . . . . .184F.3对应于语言变量距离的模糊集。 . . . . . .184G.1 图中显示了SIMD指令如何实现并行计算，而单个指令对单个数据进行操作（英特尔，2011年）。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .185G.2 该图显示了不同的数据类型如何适应128位寄存器（上图图的一部分）和256位寄存器（下半部分）（英特尔，2011年）。. .186xvDD----RRRR表的列表1.1表表示我们为XAI方法提出的分类。本表中分类的方法见第1.3节。没有同时依赖于透明性和模型不可知性的方法的例子，因为根据定义，模型不可知性方法不依赖于在任何模型上。...................................................................................................331.2评价解释的标准（Baaj和Poli，2019）。它们分为三类：自然语言、人机交互和内容与形式。第一类旨在评估解释中使用的语言的正确性。在第二类中，当解释从系统传输到用户时，标准能够评估解释传达的内容。第三类是dedi-这是为了评估解释的内容和形式。...................................................................354.1一篮子市场问题的数据库示例。我们称之为数据库market市场4.2与市场相关的正式背景的表示（参见 Ta -表4.1）。为了更好地可视化形式上下文，不显示零。..................................574.3一个模糊数据库Dfuzzy表示为一个模糊形式背景。..........................................614.4模糊数据库Dfuzzy664.5FCC1在左边，FC1在右边。从FCC 1修剪为FC1，因为它不频繁。........................................................................................ 694.6FCC2在左边，FC2在右边。................................................................................694.7FC694.8获取频繁项集。粗线表示派生项集。从从左至右：L3、L2和L1695.1模糊数据库Dfuzzy.对于大于或等于0.5的最小支持，我们可以知道在处理了前四个事务之后，{}不可能是频繁的。但对于我们需要在t5中对其进行评估，以评估其是否频繁。........................................725.2此表显示了关系之间的四种类型的含义，方法可以处理。这些暗示使得一种关系的结果能够传播到另一种关系。1和2是两个p元模糊关系，定义在空间A上的元素。e是在A p 78上定义的实体的元组.....................................5.3回顾我们在关系之间考虑的不同类型的链接及其在图表示中的符号。第三列指定如何在图形中表示相应的边。1和2是定义在空间A79上的两个p6.1我们在第4xvi7.1原始RCC中拓扑关系的定义（Randell et al.，1992）和模糊RCC的区域u和v在一个宇宙U（Schock-Aert等人， 2009年）。 t是左连续t-范数，t是残差与测试对应的暗示者。 . . . . . . . . . . . . . .−→..........................................1068.1执行时间ms为一个模糊景观计算与可变的图像大小和4096像素为中心的模糊广场。粗体表示每种情况下的最佳结果。.........................................................................1288.2执行时间为毫秒为一个模糊景观计算与可变的图像大小和一个65536像素为中心的模糊广场。粗体表示每种情况下的最佳结果。.........................................................................1288.3以反向算法为参考，对可变图像和参考对象大小进行加速。粗体字表示每种方法的最佳结果案子.....................................................................................................................1288.4一个模糊景观计算的执行时间（ms），可用的活动内核数量和参考对象大小。.........................................................1298.5以Bloch算法为参考的加速比，具有可变的图像和参考对象尺寸。.............1309.1表中显示了在执行嵌套交叉验证时，每类器官的几个结果，外环中有5个折叠。首先，为每个类给出与关系的频繁子集的学习相关联的最小支持度。在第二列中，显示了我们在学习结束时为每个器官类别获得的约束的平均数量。最后，我们展示了在测试过程中每个注释的平均置信度（准确性100%）。........................................................................................................... 1469.2表中显示了使用我们的第二启发式算法（参见第74页第5.3节）。按照我们在第141页第9.2.2节中得到的拓扑排序，显示了每个逻辑链接的结果。总的来说，这一战略能够防止1636评价-评价次数占评价总数的7.6%。...................................................................

下载后可阅读完整内容，剩余1页未读，立即下载