没有合适的资源?快使用搜索试试~ 我知道了~
智能系统与应用16(2022)200113一种基于论证Bettina Fazzinga,Andrea Galassi*,b,Paolo Torroni baDICES,卡拉布里亚大学,Via Pietro Bucci,Rende,87036,意大利b意大利博洛尼亚大学,Via Risorgimento 2,博洛尼亚,40136A R T I C L EI N FO关键词:对话系统论证数据保护EX plainable AITrustworthy AIMSC:68T5068T3568T99PACS:0705A B S T R A C T对话系统是一类越来越受欢迎的基于人工智能的解决方案,用于支持与许多领域的用户进行及时和交互式的通信。由于用户在与此类系统交互时显然有可能泄露其敏感数据,因此确保系统遵守相关法律、法规和道德原则应成为首要关注的问题。在这种情况下,我们讨论了这些方面的主要开放点,并提出了一种基于计算论证框架的方法。我们的方法确保用户数据根据数据最小化,目的限制和完整性进行管理。此外,它还具有为系统响应提供动机的能力,以提供透明度和可解释性。我们使用COVID-19疫苗信息系统作为案例研究来说明该架构,讨论其理论特性,并对其进行经验评估1. 介绍对话系统是商业AI产品中最受欢迎的形式之一。在2019年GartnerCIO调查中,CIO将聊天机器人确定为企业中使用的主要基于AI的应用程序,1全球市场价值数十亿美元。2事实上,聊天机器人是人工智能技术变得越来越普遍的一个例子,无论是在应对全球挑战方面,以及日常生活中的一些问题公共管理部门也在采用聊天机器人进行关键行动,例如帮助公民请求服务3并提供更新和信息,例如,COVID-19(Amiri和Karahanna,2022; Miner等人, 2020年)。然而,随着智能技术的发展,人们越来越担心可能的滥用,这促使人们需要开发值得信赖的人工智能系统。一方面,政府面临着获得或保持智能技术优势的压力,这些技术密集使用大量数据。另一方面,人们越来越意识到对数据的根本需求保护条例。更复杂的是,不同的司法管辖区有不同的数据保护法规。事实上,对个人隐私的威胁是真实存在的。 例如,最近的一次骚动是由于新加坡警方也可以使用追踪方案,这与早先的隐私保证相反。所有这些都促使人们需要一个值得信赖的人工智能。根据几项研究,包括人工智能高级专家小组制定的道德准则,5值得信赖的人工智能系统不仅需要强大,而且要尊重所有适用的法律,法规,以及道德原则和价值观。值得信赖的人工智能的原则包括隐私和数据治理,透明度,兼容性。特别是对于对话系统,Saglam等人的研究。(2021)表明,对它们不信任的一个主要原因是用户关于隐私和数据治理,在聊天机器人的背景下,我们认为应该通过从一开始就考虑数据访问的架构设计来确保对数据的合法访问,从而保留用户对其数据的代理权。这是* 通讯作者。电子邮件地址:a. unibo.it(A.Galassi)。1https://www.gartner.com/smarterwithgartner/chatbots-will-appeal-to-modern-workers/。2https://www.mordorintelligence.com/industry-reports/chatbot-market。3https://www.canada.ca/en/employment-social-development/services/my-account/terms-use-chatbot.html。4https://www.bbc.com/news/world-asia-55541001。5https://ec.europa.eu/digital-single-market/en/news/ethics-guidelines-trustworthy-ai。https://doi.org/10.1016/j.iswa.2022.200113接收日期:2022年4月21日;接收日期:2022年7月22日;接受日期:2022年8月12日2022年8月18日在线提供2667-3053/© 2022作者。爱思唯尔有限公司出版这是CC BY许可下的开放获取文章(http://creativecommons.org/licenses/by/4.0/)。可在ScienceDirect上获得目录列表智能系统及其应用杂志主页:www.journals.elsevier.com/intelligent-systems-with-applicationsB. Fazzinga等人智能系统与应用16(2022)2001132对于需要不同法律实体之间交互的应用程序尤其如此。例如,考虑政府的聊天机器人,为公民提供有关COVID-19疫苗的信息。让我们说,这样的聊天机器人依赖于一个跨国或区域机构,该机构提供有关该主题的医学专业知识。提供相关信息-因此,系统需要引出用户个人的、可能敏感的数据。因此,数据处理仅限于特定的目的,符合用户的需要,只有必要的用户,数据被存储和传输。此外,用户应该能够调查和理解AI系统建议背后的原因,而不必精通技术。最后,我们认为,当人工智能聊天机器人必须处理个人数据并提供建议时,可识别性尤为重要:特别是模型和人工智能。用于提供此类咨询意见的租赁机构应透明和可核查。因此,我们提出了一个受可信赖人工智能的原则和价值观启发的对话系统架构,它以以下方式明确地解决了上述问题:以自然语言进行用户交互,不仅是为了向用户提供信息,而且是为了回答用户关于导致系统输出的原因的询问(可解释性);该系统基于透明推理模块选择答案,该模块建立在具有严格、可验证语义(透明性、可验证性)的计算论证框架之上;用户数据的处理是根据数据最小化、目的限制和存储限制原则进行的。为此,自然语言接口和推理模块被解耦,以确保没有个人数据从一个模块传递到另一个模块(隐私和数据治理)。本文展示了该方法的可行性,并通过一个旨在提供COVID-19疫苗建议的AI聊天机器人来展示其工作原理。我们的目标是朝着弥合基本的,也许是抽象的道德原则和实际的人工智能应用之间的差距迈出一步。在我们以前的工作中(Fazzinga等人,2021 a; 2021 b),我们提出了一个非常一般和初步的想法,我们的框架没有正式化,并提供了一个非常初步的评估。在这里,我们提出了一个详细和完整的概述我们的架构,详细描述每个部分,提出了算法和我们的战略的正式属性,并包括一个更广泛和强大的评估。本文的结构如下:第二部分介绍了本文的法律背景和相关工作。在第3节中,我们提出了我们的方法,而在第4节中,我们讨论了COVID-19疫苗的说明。第5评估了方法,第6得出结论。2. 背景我们提出的隐私保护人工智能对话系统的建议建立在语言技术(对话系统)、知识表示(作为非单调推理和可解释性框架的论证)以及欧洲最新数据保护法规的基础上。在本节中,我们提供了必要的背景,并评论了我们的建议与相关工作的最重大差异。2.1. 欧盟的数据保护在欧盟,任何个人数据的处理,在这种情况下,个人数据必须遵守一套规则和原则,这些规则和原则对处理数据的人规定了义务,并对个人数据所涉及的人赋予了权利。 欧盟通用数据保护条例6(GDPR)6https://eur-lex.europa.eu/eli/reg/2016/679/oj。具有普遍适用性,不仅捍卫数据保护的基本权利,而且旨在保护个人数据处理所涉及的所有基本权利和自由(Hil-debrandt,2020)。与本文的目的特别相关的是GDPR特别是,第5(1)条规定了必须指导个人数据处理的原则这些限制包括目的限制、数据最小化、存储限制以及完整性和机密性。前三条规定,个人数据的收集和处理必须仅限于为实现特定目的而严格必要的范围,不得进一步保留或处理,而后者旨在保证个人数据的适当安全。相反,第5条第2款涵盖了问责制,并规定数据控制者,即确定个人数据处理目的和方式的法律机构,必须能够证明遵守所有这些原则。2.2. 文档编辑和清理非结构化文本数据的匿名化仍然是一项开放且具有挑战性的任务(Batet和S'anchez,2018;Lison等人, 2021年)。已经提出了各种方法。编辑是对文本文档的处理,目的是删除个人敏感信息(Szarvas等人,2007年)。相反,净化用更一般和非个人的变化来代替这样的信息(Chakaravarthy等人,2008年)。不幸的是,当前的编辑和清理技术仍然远远不能保证用户的零风险(Li等人,2017年)。常见的解决方案只关注预定义的实体类别。如果它们确实可以作为有用的隐私增强技术,那么它们不符合GDPR等法规所定义的完全匿名化,因为它们忽略了可能在重新识别个人方面发挥作用的元素(Lison等人,2021;Pi la'n等人, 2022年)。此外,最成功的方法限于特定领域,并且通常依赖于大型的难以获得的数据集(Hassan等人,2019;Iwendi等人,2020;Nguyen和Cavallari,2020;Sa'nchez 等人, 2014年)。我们的方法与上面的方法不同,因为它不共享或保存用户信息,而是用一组与用例相关的通用的、“净化”的信息元素来代替它2.3. 对话系统虽然术语变化很大,但在面向会话和面向任务的对话系统之间存在普遍接受的区别。会话代理旨在支持开放域对话。它们通常被称为聊天机器人。相反,面向任务的对话系统旨在帮助用户完成给定领域中的明确定义的任务(Chen等人,2017; Deriu等人,2021年)。这些任务可能包括执行特定操作或获取用户信息,或者像我们的情况一样,向用户提供信息对话响应通常涉及四个阶段:理解问题、管理对话、可选地执行动作和生成答案。虽然这些步骤可以通过管道架构单独管理,但最近的许多文献都涉及端到端神经方法。 传统的管道结构存在问题,lems在所有组件中传播用户模块化的优点被这种模块的相互依赖性所阻碍,阻碍了流水线系统对新领域或新任务的适应(Wen等人,2017;ZhaoandEs k'enazi,2016). 深度学习架构在许多NLP任务中的成功,其中包括自然语言理解和生成(Galassi等人,2021;Young等人,2018),促使研究人员广泛研究其在该 领 域 的 应 用 ( Luo et al. , 2019; Mohamad Suhaili 等 人 , 2021;Rajendran等人,2018年)。这种方法的缺点是,对于新任务来说,它们的实现成本通常很高,因为它们需要大量的训练数据集。此外,数据驱动的对话系统易受偏见影响(Barikeri等人,2021; Dinan等人,2020;Liu等人,2020年),侵犯隐私,对抗性的例子,以及其他几个道德问题···B. Fazzinga等人智能系统与应用16(2022)2001133关于我们()()()〈〉联系我们联系我们和安全问题。Henderson et al.(2018)提供了广泛而深入的讨论。考虑到我们对用户保护的关注以及我们开发通用的、数据独立的方法的目标,我们选择了一种不 涉及 培训,是模块化的。 我们的方法使用技术在基于信息检索的对话系统中很常见,其中用户的句子被视为查询,并且从由对话组成的知识库中检索答案。例如,Charras等人。(2016)比较了句子的TF-IDF表示之间余弦相似性的使用, 和 具体 训练 doc-to-vec嵌入 (乐 和Mikolov,2014)。同样,我们测量句子嵌入之间的相似性,以匹配用户句子与知识库提供的句子。然而,我们依赖于预先训练的模型和领域专家生成的sani- tized文本据我们所知,我们是第一个引入对话系统架构的公司,其设计目标是确保用户数据保护。事实上,先前关于敏感的健康数据的工作(Bri Xey等人,2017年; Xu等人,2019)没有专门解决用户和数据保护问题。关于在对话 系统中使用论证, 以前的作品主要集中 在说服。Rosenfeld和Kraus(2016)依赖于强化学习,而Rach等人(2018)将对话设想为游戏,答案沿着先前定义的方案移动。在这两种情况下,智能体 的 输 入 和 输 出 都 局 限 于 知 识 库 中 的 句 子 。 Chalaguine 和 Hunter(2020)提出了一个有说服力的对话系统来说服学生大学学费的重要性。该方法基于知识图,其中每个可能的用户句子被编码在节点中,并且其所有答案通过边与其链接。当用户写一个句子时,系统在图中搜索与用户句子匹配的参数,并在与之链接的节点中选择一个答案给用户。虽然这个系统肯定与我们提出的系统有关,但它也有很大的不同,答案的选择是可能的答案由用户提出的最后一个问题,而忽略了什么是前面说的。缺乏对话的历史,以及随之而来的在单个交换中检索多条信息的不可能性,强烈限制了这种系统在现实世界场景中的应用,在现实世界中,对话自然会考虑到在不同时间说的话。这些方法的另一个局限性是它们依赖于词汇而不是语义相似性。2.4. 2019冠状病毒病疫情对话系统Chalaguine和Hunter(2021)开发了一个有说服力的聊天机器人来说服用户接种新冠疫苗,使用的技术与他们之前的工作相同。DosSantos Júnior等人(2021)专注于自然语言理解,并研究使用嵌入和聚类算法来自动注释带有意图标签的Covid相关对话的数据集。VIRA系统(Gretz等人,2022)被训练以在一组候选中识别用户的意图,并且用对应的用户意图中的一个来回复。答案Altay等人(2021)研究了使用聊天机器人的积极影响,Judson等人(2020)强调了用户这些作品都没有解决处理用户敏感数据和相关隐私问题。此外,除了对说服性对话系统的一些关注之外,据我们所知,还没有对向用户提供可靠信息的有关在新冠肺炎公共卫生应对中使用聊天机器人的更多详细信息,请参见Amiri和Karahanna的调查(2022)。2.5. 论证框架摘要论证(Abstract Argumentation,AA)(Dung,1995)是人工智能(Artificial Intelligence,AI)的一个分支,由于其模拟辩论,对话以及一般情况下出现冲突和意见多样性的能力,在过去几年中获得了极大的关注 导致使用AA作为AI中几个基于对话的应用程序的核心推理机制的一个重要点也是其提供解释性解释的自然能力(Modgil等人,2013年)。事实上,近年来,为系统/代理行为提供动机的能力在人工智能中变得至关重要,AA正在发挥越来越重要的作用(ChesnEscherevar等人,2020;Cyras等人, 2021年)。事实上,将辩论/对话建模为AA框架不仅提供了在反驳中定位代表好/坏观点的论点的可能性,而且还具有可能提供为什么某个论点是好/坏观点的原因的可验证的证据的进一步优势。从技术角度来看,AA中的争议被建模为图,其中,作为参与争议的代理所主张的句子的论点作为示例,考虑以下场景。安德里亚说,论点一:米兰是一个非常宜居的城市。马特说论点b:米兰是世界上污染最严重的城市之一,所以它绝对不适合居住。爱丽丝说,论点c:有几个参数被用来确定一个城市是否宜居,因此你不能说米兰不宜居。这种情况可以建模为AA图A,D,其中A由参数a,b,c组成,D由边a,b,b,a,c,b组成。大量的工作已经致力于论证图上的推理(Baroni和Giacomin,2009;Charwat等人, 2015; Fazzinga等人,2019),并且已经提出了识别非鲁棒的参数或参数集的几种方式,称为语义(Dung,1995; Dung等人,2007年)。一个流行的是可接受语义学。它规定了一个参数集S是一个可容许的扩展(也就是说,它符合可容许的语义),当且仅当(i)S是无冲突的,即S中的参数之间没有攻击,(ii)S为其中的每个参数辩护,即。例如,S攻击所有攻击S中参数的参数(S之外的参数)。条件(ii)揭示了可接受语义是基于接受的基本概念:是一个可接受的扩展,S的每个参数a必须是可接受的w.r.t.这意味着S必须反击来自外部对A的每一次攻击。继续上面的例子,C 和s2素八是可容许扩张,而S3甲乙丙和s4和218c 并不是,因为它们不是没有冲突的,S5也不是 B 因为b是不能接受的w.r.t. S5:事实上S5是这样的不保护B免受C的攻击。3. 架构和方法为了说明我们的建议,让我们考虑一个政府打算通过对话系统向其公民提供个性化的信息服务。在许多不同的场景中,用户和系统之间的交互是相似的,而信息的后端检索则取决于具体情况。也可以合理地设想这样的情况,即服务部门用于检索具体信息的知识库可能不是由实体本身维护或拥有,而是由第三方维护或拥有,例如提供专门医疗知识的跨国机构。在这种情况下,当与知识库的交互由第三方处理时,对话系统的提供者必须向用户保证,保护他们的个人信息。第三方在内容和时间上都必须限制在计算相关答案所严格需要的范围内。因此,服务提供商有责任向用户询问相关信息,分析和处理它们,保证删除任何不相关的信息(但可能是敏感的),并保证所维护的数据集作为一个整体保证匿名。B. Fazzinga等人智能系统与应用16(2022)2001134Fig. 1. 系统架构和与用户交互的示例。句子被表示为矩形并用S表示,而圆形用于状态和应答节点(分别用N和R表示)。我们代表一种情况,其中节点和句子涉及两个概念A和B,而用户句子涉及B。用户提供的信息用绿色和对角线表示。很容易看出,这样的信息不会到达论证模块。(For对于图中颜色的解释,请读者参考本文的网络版本。)因此,我们提出了一种由以下组件组成的对话系统的模块化架构:由专家制作的知识库(KB),包含所有可能的相关案例、答案以及它们之间的关系;语言模块,其处理所述用户sitive信息,并将其映射到相应的KB案例;- 用于对这样的KB案例进行推理并计算答案的论证模块对话过程如图1所示,可以总结如下:1. 用户与语言模块交互,提供满足其请求所需的2. 语言模块将用户信息与知识库进行比较,以了解哪些情况是相关的。3. 语言模块与Argumen建立连接-tation模块,并向其提供用户信息的匿名、净化和通用化版本4. 论证模块阐述了信息和通信,给出一个答案。5. Argumentation模块将答案发送到Language模块,后者将其转发给用户,并可选地对其进行进一步处理。这样的回答可以是用户所要求的信息,或者是对提供适当回答所需的进一步个人信息的请求。6. 如果需要更多信息,则过程返回到第2点。7. 如果用户已经收到最终答案,他们可以要求对答案的详细解释,这将由论证模块提供。8. 一旦用户决定终止交互,模块之间的连接就会关闭,与用户相关的所有信息都会被删除。需要强调的是,个人和敏感数据的交换仅发生在用户和语言模块之间。论证模块只能访问提供答案所必需的一般和广泛的代表。此外,任何被语言模块视为无关的信息永远不会到达下一个模块。这两个属性分别反映了数据最小化和目的限制的原则。该架构还适合客户端-服务器场景,其中语言模块托管在客户端,而论证模块托管在服务器端。客户端可以被实现为安装在用户的个人设备上的应用程序,而与服务器交互的会话是完全匿名的:用户的个人信息永远不会离开他们的设备,除非它与答案相关。我们将注意到,我们的主要重点是处理用户个人数据以及如何使用这些数据来产生最终答案。在实施该系统时,还必须解决对话管理等其他方面的问题,但这些问题不属于本项工作的范围,因为它们不会对用户隐私构成挑战···B. Fazzinga等人智能系统与应用16(2022)2001135←∅∅←←()←←←←∪←∅←∅←联系我们←∈⊆∅∅←←∅∪←∈←∪←∪联系我们()←联系我们图二. 一个论证图。1:startConversation()2:UacquireUserSentence()3:S,RY,rNULL四: 而U不是一个停止句,5:如果U不是解释请求,则6:NcomputeMatches(U)7:S S N8:缺点,PCons检索回复(S,N)9:如果缺点,则10:rselectdateReply(缺点)11:replyToTheUser(r)12:RY=RY r13:其他14:如果PCons= 则15:terminateConversation()16:如果结束17:回答引出(S,PCons,RY)18:如果回答是否定的,那么19:terminateConversation()20:如果结束21:如果结束22:其他23:ExplretrieveExplanation(S,r)24:replyToTheUser(E xpl)25:如果结束26:Unique()二十七: end while算法1. 对话系统。因此可以用文献中已经可用的任何技术来实现。在本节的其余部分,我们将详细描述每个组件,并提供通信过程的正式定义。3.1. 知识库我们将背景知识编码到由状态节点和回复节点组成的参数图中。前者编码对应于可能的用户语句的事实。每个状态节点都链接到它认可的一个或多个应答参数。状态节点也可能攻击其他状态或回复节点,通常是因为它们表示的事实彼此不兼容。事实上,在我们的论证图中,我们假设状态论证之间的所有攻击都是相互的。定义3.1.(论证图)论证图是一个元组G=<$A,R,D,E<$,其中A和R是图的参数,分别称为状态参数和应答参数,D<$A×(A<$R)编码攻击关系,并且对于每个(a,b)∈D|a,b∈A,则(b,a)也∈D,并且E<$A×R对一曰: 对于所有r个PCons,2:N个selectDefenceNodes(S,r)3:N新4:对于所有nN个5:N=replyAcquireMatch(n)6:N新N新N7:结束8:S S Nnew9:如果N是新的S,则10:如果RY是 ,则11:r=getReply(RY)12:replyToTheUser(r)13:返回TRUE14:如果结束15:其他16:如果r是一致的回复,则17:replyToTheUser(r)18:RY=RY r19:返回TRUE20:其他21:缺点,PConsJretrieveReplies(S,Nnew)第22章:你是谁?23:rselectdateReply(缺点)24:replyToTheUser(r)25:RY=RY r26:返回TRUE27:其他28:PCons=PCons PConsJ29:如果结束30:如果结束31:如果结束32:结束第33章:一夜情算法2. 功能引出(S,PCons,RY)。图三. 论证图G1.图四、 一个 格 式 不好的论证图。B. Fazzinga等人智能系统与应用16(2022)2001136()∈()∈()()}={( )}={})={}={(=图五、 关于COVID-19疫苗知识的论证图摘录。图第六章关于英 国 移 民 知 识 的论证图的 摘 录 。背书关系7.攻击关系。在几组攻击或赞同的答复中,我们说a攻击(分别是,认可)应答节点r,当且仅当a,r D(分别,a,r E)。通过扩展,我们说集合S攻击(分别,支持)R,或者等价地R被(相应地, 背书)S,当且仅当存在一个参数a∈Ss. t。A攻击(分别地,赞同)r.例1. 考虑图2中的论证图GA,R,D,E,其中Aa1,a2,a3,a4,Rr1,r2,Da1,a2,a2,a1,a1,r2,a2,r1 ,Ea1,r1,a2,r2,a3,r1,a4,r2,其中虚线表示背书关系,实线表示[7]请注意,我们的支持关系不同于Cayrol和Lagasquie-Schiex(2005)以及Boella等人(2010)在双极AF(BAF)中定义的支持关系。事实上,BAF有唯一的一组参数A,支持关系是A×A的子集,而我们的背书关系是A×R的子集,因此它只涉及对状态,回复状态。此外,BAF的支持关系也影响扩展(事实上,根据所考虑的支持的类型已经定义了容许语义的几个变体),相反,我们的认可关系只影响要给予用户的回复的选择:节点被接受的事实。一个集合只取决于攻击关系,就像在经典AF中所做的那样我们有:集合S1={a1,a2}攻击r1和r2,而集合S2={a1,a3}攻击r2,集合S3={a3,a4}同时支持r1和r2。此外,A中的每个参数都用一组自然语言句子注释,这些句子表示用户将表达A意图编码的事实的一些可能方式。这些不同的事实表示可以由领域专家产生,或者由Chalaguine和Hunter(2020)提出的众包,然后由领域专家验证。R中的每个参数都用一个或多个自然语言句子来注释,这些句子表达了它编码的答案3.2. 语言模块语言模块有双重用途:映射用户信息与适当的知识库节点,并过滤掉敏感信息。与Chalaguine和Hunter(2020)类似,我们的目标是将用户提供的信息与KB中的自然语言句子进行比较,特别是与状态节点相关的句子。一旦我们确定了这些KB句子中的哪些与输入句子相似,我们就获得了相关联的状态节点的集合S。这样的集合表示由用户传达的与通信相关的所有信息。B. Fazzinga等人智能系统与应用16(2022)2001137表1嵌入模型和阈值准则在句子匹配任务上的初步实验结果。对于每个模型,我们只报告3个固定阈值,即达到最佳精度、召回率和F1的阈值。型号阈值P R F1平均值(0.19)0.27 0.71 0.39平均值+标准差(0.41)0.34 0.39 0.360.65 0.50 0.14 0.220.25 0.28 0.610.20 0.26 0.68平均值(0.46)0.331.000.50匹配,只要它们是准确的,就不会对架构的其他部分产生影响。Chalaguine和Hunter(2020,2021)使用TF-IDF向量表示句子,并使用余弦相似度(Kenter和de Rijke,2015)进行比较,仅选择KB中最相似的句子。相反,我们建议使用句子嵌入,它允许将句子表示为实值向量,将其映射到语义向量空间。与TF-IDF相反,这种技术允许将具有相似语义内容的句子映射到附近的向量中,即使它们从词汇的角度来看非常不同。代替余弦相似性,我们建议使用Bray-Curtis相似性(Bray和Curtis,1957年),因为它在判决MPNet-SMPNet-PMPNet-PMTBERT-PMiniLM-PDBERT-NQ表2平均值+标准差(0.63)0.991.00 0.990.86 0.920.651.000.970.990.60 0.921.000.96平均值(0.51)0.321.000.49平均值+标准差(0.67)0.991.00 0.990.751.000.86 0.920.94 0.970.65 0.961.000.98平均值(0.52)0.311.000.47平均值+标准差(0.68)0.99 0.97 0.980.751.000.81 0.900.93 0.960.65 0.901.000.95平均值(0.46)0.401.000.57平均值+标准差(0.62)0.72 0.99 0.830.46 0.630.65 0.81 0.94 0.870.60 0.611.000.75平均值(0.42)0.431.000.60平均值+标准差(0.63)0.55 0.96 0.700.43 0.570.65 0.57 0.87 0.690.60 0.511.000.68平均值(0.39)0.371.000.54平均值+标准差(0.59)0.50 0.75 0.600.801.000.17 0.300.55 0.49 0.860.40 0.391.000.56相似性(Galassi等人,2020年)。最后,由于用户的句子可能包含与KB的多个节点相关的信息,因此我们不选择仅最相似的节点,而是使用阈值超参数来区分相似和不相似的句子。在许多可能的句子嵌入中,我们决定使用Sentence-BERT(Reimers和Gurevych,2019),它基于在大量数据上训练的深度网络模型,专门为句子相似性任务而设计。这个选择是有动机的 近年来,它们在自然语言处理的进步中发挥了关键作用。选择是从头开始训练嵌入模型,使用预先训练的模型,还是微调预先训练的模型,取决于特定的应用领域和可用于训练的数据。这种方法的缺点是它需要能够加载神经模型的硬件资源,这在某些情况下可能是不可行的。作为替代方案,GloVe嵌入(Pennington等人,2014)通常性能较差,但不涉及神经模型的使用,因此可能适用于一般情况。我们提出了计算匹配的相似性之间的森-tence嵌入,但重要的是要注意,我们的一般体系结构也将与其他方法兼容。一种可能的替代方法是使用直接计算两个句子相似性的技术。这可以使用诸如Damerau-Levenshtein相异度(Damerau,1964)的特定算法或诸如Poly-Encoders(Humeau)的神经网络来实现例如, 2020年)。 然而,这种替代方案将有一个沉重的计算-在我们的案例研究中使用的节点以及与之相关的句子示例节点ID已发送。ID语句N1 S1 I am celiacN2 S8我不是乳糜泻N3 S12 I不存在免疫抑制N4 S19我最近发现免疫抑制N5 S20我没有任何药物过敏N6 S28我有严重的药物过敏N7 S34我N8 S38我患有支气管哮喘N9 S41我有糖尿病N10 S46我N11 S50乳胶引起我过敏反应N12 S52我不过敏乳胶N13 S59肥大细胞增多症对我来说不是健康问题N14 S60我患有肥大细胞增多症N15 S66我之前过敏性休克N16 S67我从未经历过严重的过敏反应任务,因此需要Argumentation模块计算答案所需的信息。这种表示是完全匿名的和通用的,因为它不包括用户的原始输入,也不包括关于单个匹配句子的信息。它可以有效地被认为是用户输入的净化版本。此外,用户提供的任何其他无关但潜在敏感的信息将导致与KB语句不同的结果。因此,S是用户提供的计算答案所需的最小信息(有许多可能的策略可用于计算因为它需要在运行时处理每对句子。相反,基于句子嵌入的方法将非常快,因为所有的KB嵌入都可以预先计算,并且数值向量之间的比较相当便宜。最后,重要的是要意识到句子嵌入对某些概念建模的能力可能仍然是不完善的。例如,BERT(Devlin等人,2019)可以更好地捕获否定(Lin等人,2020; Zhu等人,2018),而GloVe可能更好地理解标点符号(Karami等人,2021年)。在某些情况下,可能需要部分或完全依赖于其他技术,以便获得更好的匹配,例如,附加的预处理步骤、姿态检测、基于规则的模型或本体的使用。3.3. 论证模块论证模块负责计算对用户查询/句子的回复。为了理解我们的方法,重要的是要理解仅根据最后一个用户句子选择回复的局限性,正如Chalaguine和Hunter(2020)所做的那样。让我们考虑这样一种情况,用户在COVID-19疫苗的背景下与对话系统交互,以了解他们是否可以安全接种疫苗。在这种情况下,可能存在使一些候选回复无效的条件,这些条件没有被用户最后一句的内容揭示或排除,并且需要进一步的信息:该信息可以是已经可用的(因为它包含在用户已经错误声明的内容中)或者需要通过收集用户对特定新问题的答案来收集。例如,假设用户说:“我是乳糜泻患者,我可以得到接种疫苗?- 是的在乳糜泻患者的情况下,TF-IDFB. Fazzinga等人智能系统与应用16(2022)2001138=⊆关于我们〈〉⊆∈关于我们==∈联系我们{()()()()}={()()()( )}=见图7。 由模型使用从S1到S19的句子的0.65阈值计算的匹配。 彩色单元格表示两个模型计算的匹配。这个问题的答案是R是的,您可以在任何疫苗接种点接种疫苗。不需要特殊的监测时间。8事实上,对于患有乳糜泻的人来说,没有已知的特定副作用因此,乳糜泻患者不需要在医院接种疫苗或接受特定的监测时间。然而,假设用户也患有支气管哮喘。在这种情况下,正确遵循AIFA指南的答案是“是的,但你必须在医院接种疫苗。问题在于,通过仅查看当前用户语句来选择如何回复用户可能是不安全的:对话系统应该进一步调查用户的健康状况,以便排除使候选回复不合适的任何病理。在上面的示例中,在向用户给出回复R之前,对话系统应该询问用户他们是否患有支气管哮喘和/或其他(少数)使R不合适的疾病。此外,对话系统应该跟踪用户所说的一切(与Chalaguine和Hunter所做的不同),因为对任何进一步的用户问题的回答必须考虑用户提供的所有相关信息,否则存在给出可能误导用户的回答的风险。3.3.1. 应对策略我们准备提出我们的策略,为用户提供答复和算法编码。每个对话会话依赖于动态获取的知识,表示为一组状态参数S,编码用户信息。基本上,S包含到目前为止激活的KB的状态节点,其对应于自对话会话开始以来用户已经传送到系统的信息。与其他建议不同,在每一轮,我们的系统不只是选择一个由S认可的答复。相反,对话策略的目的是为用户提供一个既被S认可又被S辩护的回复。换句话说,该系统只提供可靠的答复,可能会延迟需要进一步事实核查的答复。8摘自AIFA网站的常见问题部分:https://www.aifa.gov.it/en/vaccini-covid-19/。事实上,我们的系统区分了一致的和潜在一致的回复。前者可以立即提供给用户,作为,作为在3.3.2节中正式声明,它不可能在未来被证明是错误的。9后者,尽管与当前已知的事实一致,但仍可能被未来的用户输入击败,因此应该延迟,直到成功的诱导过程完成。下面报告的正式定义基于KB和由集合S组成的对话状态的表示。特别是,SA包含了到目前为止在会话期间激活的所有参数,并且被认为是无冲突的。此外,这两个定义都是基于可接受的论点的概念,在第2中回顾过。定义3.2. (一致的回复)给定论证图G A,R,D,E和无冲突集合SA,回复rR与W. R. T一致。S当且仅当S支持r且r是可接受的。S.定义3.3.(潜在一致的回复)给定论证图G A,R,D,E和无冲突集合SA,回复rR潜在一致于S当且仅当S支持r,S不攻击r且r对于r. r. t是不可接受的。S.下一节将更清楚地说明,这一战略的目的是寻求对用户的投入作出一致的答复。如果不存在一致的回复,那么策略是寻找潜在的一致回复,并试图使其中一个成为一致的回复。下面的示例显示了一致和可能一致的答复。实施例2.考虑E例 1中引入的论证图GA,R,D,E,其中Aa1,a2,a3,a4,Rr1,r2,Da1,a2,a2,a1,a1,r2,a2,r1,Ea1,r1,a2,r2,a3,r1,a4,r2、和S在3.因为r1被2攻击,而S不防守,所以r1不是一个一致的回复。然而,r1是一个潜在的一致的回复,因为它被S认可,而不是被S攻击。在S a1,a3的情况下,r1是一致的回复。除了提供回复外,系统还可以提供9这里隐含的假设是用户没有输入冲突的信息,并且语言模型正确地解释了用户输入。显然,如果不是这种情况,系统的输出将但这不会依赖于潜在的推理框架。能够处理此类异常的回退策略的定义将是对系统的重要扩展。B. Fazzinga等人智能系统与应用16(2022)2001139={}{}{}}见图8。PCA投影和归一化后编码句子的可视化。从N1到N6的节点通过不同的颜色表示;按顺序:红色,绿色,蓝色,橙色,青色和黑色。(有关本图例中颜色的解释,请参阅本文的网络版本对所给答复的解释。回答r的解释由两部分组成。第一个包含导致r的参数,即,属于支持r的集合S的那些。第二个编码why not,解释为什么系统没有给出其他回复。定义3.4.(说明)给定一个论证图G=A,R,D,E,一个集合SA和一个回复r∈R,r的解释是一对End,NotGiven,其中End包含参数a∈Ss.t。(a,r)∈E和NotGiven是一个对集合<$r′,N′<$,其中r′ scin=r,r′由S和N′支持 ⊆S包含攻击r′的自变量b。实施例3.继续前面的例子,在Sa1,a3,a4,由下式给出一个一个三r2,a1这意味着r1已经被给予用户,因为它被1和3背书,并且r2不能被给予用户
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- StarModAPI: StarMade 模组开发的Java API工具包
- PHP疫情上报管理系统开发与数据库实现详解
- 中秋节特献:明月祝福Flash动画素材
- Java GUI界面RPi-kee_Pilot:RPi-kee专用控制工具
- 电脑端APK信息提取工具APK Messenger功能介绍
- 探索矩阵连乘算法在C++中的应用
- Airflow教程:入门到工作流程创建
- MIP在Matlab中实现黑白图像处理的开源解决方案
- 图像切割感知分组框架:Matlab中的PG-framework实现
- 计算机科学中的经典算法与应用场景解析
- MiniZinc 编译器:高效解决离散优化问题
- MATLAB工具用于测量静态接触角的开源代码解析
- Python网络服务器项目合作指南
- 使用Matlab实现基础水族馆鱼类跟踪的代码解析
- vagga:基于Rust的用户空间容器化开发工具
- PPAP: 多语言支持的PHP邮政地址解析器项目
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功