用户修复策略与聊天机器人意图识别的交互

169 浏览量更新于2023-10-31 收藏 534KB PDF 举报

聊天机器人

人工智能

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

语用学杂志204（2023）21E32“我能在星期二做扫描吗？”多丽丝·迪波尔德萨里大学文学与语言学院，吉尔福德，GU27XH，英国我的天啊N F O文章历史：2022年6月21日收到收到修订版2022年10月27日接受2022年12月8日2022年12月23日在线提供关键词：对话式AI聊天机器人人工智能人机交互维修A B S T R A C T修复描述了会话参与者解决说话，理解和听力问题的过程。在与人工智能驱动的聊天机器人的交互中，用户修复解决了聊天机器人对用户意图缺乏理解或误解的问题。本文提出了一个以用户为中心的描述用户修复策略的互动与面向任务的聊天机器人。它是基于模拟用户与聊天机器人的交互分析，以分析表明，用户最经常使用的修复策略（例如，重述）不一定是促使机器人正确识别意图并提供相关响应的策略，而不太频繁使用的自我修复策略（例如重述意图）在实现意图识别方面更成功。这表明，与对话式人工智能的交互规则需要向用户明确，因为他们缺乏对通过人工智能促进的交互的上下文、限制和模式的©2022作者（S）。出版社：Elsevier B.V.这是CC下的开放获取文章BY许可证（http://creativecommons.org/licenses/by/4.0/）。1. 介绍聊天机器人在日常生活中越来越普遍。Grand View Research（2022）估计，到2030年，全球聊天机器人市场规模将达到39.9亿美元，并以每年25.7%的速度增长，直到2030年。使用机器学习算法与人类聊天并从这些交互中学习，聊天机器人可以在各种环境中找到，包括医疗保健，零售，旅行和旅游。鉴于聊天机器人在商业和公共环境中越来越普遍，考虑到其技术限制，询问用户如何通过与机器人的交互进行导航人类与聊天机器人的互动代表了一种在线进行的社交互动形式，也被描述为计算机介导的话语（Herring，2004）。从表面上看，基于文本的聊天机器人交互与其他形式的计算机介导的话语（特别是网络聊天）有许多相似之处。每种情况下的结果都是客户/服务用户与响应服务请求的代理之间的交换然而，网络聊天和聊天机器人交互之间存在着至关重要的差异：虽然网络聊天允许用户与另一个人进行实时谈判，但聊天机器人交互看到用户与一台由或多或少复杂算法支持的机器进行交互。在人与人的互动中，说话者能够在多个回合中交互式地协商意义。相比之下，“今天的大多数聊天机器人并不能真正理解自然语言，也没有认知能力来理解他们对话的上下文”（Sheth et al.， 2019年：2）。电子邮件地址：d. surrey.ac.uk。https://doi.org/10.1016/j.pragma.2022.12.0040378-2166/©2022作者。由Elsevier B. V.发布，这是CC BY许可证下的开放获取文章（http://creativecommons.org/licenses/by/4.0/）。目录可在ScienceDirect语用学杂志杂志主页：www.elsevier.com/locate/pragmaD. 迪波尔德语用学杂志204（2023）21E3222参考Dennis et al. S（2008）的媒体同步性理论，聊天机器人的这些技术限制影响了通信过程的传输和融合过程。传达是指传递和传递新的信息，使接收者能够建立一个关于所说内容和含义的心理模型。基于意图的语言理解模型限制了机器人引用更广泛的上下文来提取这种含义的能力。用户在与聊天机器人交互时的输入在风格、拼写、结构等方面几乎可以无休止地变化，这进一步加剧了这一点。尽管表达了用户的意图，但理解用户的意图是聊天机器人面临的一个主要挑战。趋同描述了个人在建立共同理解方面的努力（Dennis等人， 2008年）。在网络聊天中，代理和服务用户能够平等地为融合过程做出贡献从表面上看，聊天机器人的互动代表了类似的互惠双向对话。然而，用户的机会“直接交流和改变其过程，要求澄清，以避免或修复沟通故障，或要求不同的速度”（肯宁，2006年：278）是有限的机器人的能力，处理这些请求时总之，人机交互在通信过程中受到一系列限制，这些限制与机器人理解自然语言和与用户协商含义的能力有限有关。这意味着人类不一定依赖于与面对面社交互动相同的沟通模式。Luger和Sellen（2016）关于用户对会话代理的期望和体验的研究发现，具有更好技术技能的参与者比期望没有改变的低技能参与者更容易接受新的交互心理模型，并且更容易对他们的交互感到沮丧因此，这项研究调查了用户自我修复策略，以应对机器人的误解或缺乏对意图的理解，对于如何支持用户开发对话式AI的沟通技能以及了解这些交互的社会语言环境这些问题将在本文件的结论部分讨论2. 文献综述本文献综述将首先参考原始CA文献定义修复然后，它将回顾计算机介导环境中的修复研究，并在聊天机器人交互和其他形式的对话AI的整体奖学金中将修复置于情境中Schegloff等人（1977：381）首先将修复描述为“在社会交往中组织语言使用的自我纠正机制”，而Seedhouse（2005：168）后来将修复定义为“在互动语言使用中发生的麻烦的治疗”。在日常会话中，说话人可以利用修正来解决听、说和理解中的问题。在与基于文本的聊天机器人对话时，用户可以使用修复来解决机器人解释其意图的问题。借鉴Albert和de Ruiter（2018）对修复的理解，即在人际交往的特定背景下，修复一直是广泛调查的主题，例如课堂（Dippold，2014;Montiegel，2021）和工作场所互动（Oloff，2018;Tsuchiya和Handford，2014）。在以计算机为媒介的环境中，修复迄今为止主要在网络聊天的背景下进行研究，例如专注于游戏聊天（Collis te r，2 01 0），德语聊天（Scho€ nfeld tanddGolato，2003），图书馆聊天（Koshik和Okazawa，2012）和Facebook聊天（Meredith和Stokoe，2014）。这些研究发现，一般原则的修复，从普通的对话，如偏好自我修复e修复发起的扬声器谁是麻烦源的原因e仍然适用，但修复的组织不同，由于不同的顺序信息流。此外，用户不能访问与在口头对话中相同的资源集合来发起或完成修复（例如，韵律），但用其他创造意义的方式进行补偿（如*作为修复词素，表示已经进行了修复修复也一直是研究用户与基于文本的聊天机器人，语音对话系统和嵌入式机器人交互的主题分析用户与面向任务的聊天机器人之间的交互记录，Li et al. （2020）研究了不同类型的非进展和用户修复类型之间的关系。他们发现，机器人用户最有可能在三次无进展的情况下放弃对话，这一方面是由于机器人对用户意图的错误识别，另一方面是由于未识别。用户利用广泛的策略来处理非进展，包括退出，临时改变主题，放弃机器人服务，临时退出对话，切换主题和各种形式的重新制定消息（自我修复），例如，重新措辞，添加，重复或删除单词，使用相同的单词，新的主题等。Ashktorab等人（2019）在实验环境中调查了银行聊天机器人使用的修复启动策略的用户偏好，发现用户更喜欢机器人通过提供潜在用户意图的选项来启动修复。用户还喜欢辅助自我修复（例如，解释哪些关键词导致机器人缺乏理解）。然而，用户的策略偏好取决于其他因素，例如他们对聊天机器人的社会取向，他们的功利取向，他们对聊天机器人和技术的经验以及修复结果。Følstad和Taylor的研究（2020年）集中在机器人启动修复的策略上，并询问聊天机器人在解释中表达不确定性并提出可能的替代方案是否会影响聊天机器人在信息，过程和结果层面的对话。他们发现，以这种方式启动修复大大减少了不相关的反应，以及提供升级或明确表达误解的后备反应。D. 迪波尔德语用学杂志204（2023）21E3223对语音识别和对话系统中用户交互修复的研究证实了人类用户的创造力和坚韧性例如，Beneteau et al. （2019）调查了Alexa和家庭用户之间的沟通障碍。他们表明，用户部署了一系列修复策略，例如，使用韵律变化，过度发音，语义调整/修饰，增加音量，句法调整，重复。在Serholt et al. s（2020）的研究，孩子们在教室里与一个会说话的机器人互动，通过适应机器人，远离机器人，或者将注意力转移到房间里的其他演员身上来进行修复。适应机器人包括夸大关节，例如缩短响应、增加音量。最后，Myers等人（2018）研究了与语音用户界面日历管理器交互的用户策略。他们确定了10种应对障碍的策略，最常用的是超清晰度（更大声，更慢或更清晰），添加更多信息，使用新的话语来表达相同的意图，以及简化。此外，他们还发现用户严重依赖猜测和探索策略。因此，这篇文献综述表明，在基于人工智能的交互中，用户可以并且确实部署了广泛的修复策略。其中许多类似于人与人之间的口头交互，但其他人在部署时会导致用户偏离其最初的交互目标（例如，改变话题）。此外，过度/超发音是一个常见的主题，特别是在基于语音的交互研究中。目前的研究通过询问说话者如何在一系列转折中试图确保前进并通过以机器人误解和缺乏理解为特征的交易序列进行导航来增加现有证据。在描述了用户修复的“3. 目标本文的目的是跟踪用户的任务为导向的聊天机器人如何使用修复策略时，机器人缺乏理解或坚持自己的意图。由于这篇论文是探索性的，它是由这个广泛的目标，而不是一套预先定义的研究问题。4. 数据4.1. 阿萨，机器人本文的数据来自与初创公司spryt.com联合进行的一项研究项目。SPRYT开发了一个智能患者调度系统，允许患者通过Whatsapp通过文本到文本的交互来安排医疗预约病人与一个名为“Asa”e的聊天机器人进行互动在数据收集时，Asa生成模板化的响应，并基于基于意图的语言理解：它对用户的总体目标是否是e.从当前会话流预订或取消约会e，但仅从用户的最后一轮解释用户的特定含义（意图）。因此，Asa只有有限的语境理解，影响了传递和聚合过程（见第1节）。当Asa被部署到这项研究中时，它还没有在真实患者身上进行测试，也没有从真实患者的互动中进行算法学习本研究对用户与Asa的对话进行了定性分析，并结合用户访谈和问卷调查的证据，为系统开发人员提供了第一次获得研究证据的机会，以改善Asa的未来发展。4.2.数据集该分析基于个人用户和预约调度机器人之间的36次交互。这些交互发生在模拟环境中，作为在面向患者的环境中部署之前系统的用户体验研究的一部分。其中10个互动是在项目的第一阶段创建的。在此阶段，进行了用户体验访谈，在此期间，用户与机器人进行交互，并被要求描述他们对机器人的交互和整个系统的看法。所有参与者都在研究人员的指导下至少尝试预约。完成后，参与者被引导完成至少一个其他场景（例如预约取消，筛选问题等）。大多数参与者完成了两个额外的场景。当研究人员认为参与者不愿意进一步延长访谈或没有什么可说的时候，他们会结束访谈。在项目的第二阶段创建了26个交互。在此阶段，用户被指示与Asa进行交互，以至少完成预订。此外，用户还被指示完成他们自己选择的其他任务，例如重新安排，取消或提出问题。参与者完成的任务数量各不相同，可能是由于他们喜欢与Asa互动的程度，以及他们对学术研究的普遍意愿。在完成互动后，参与者通过调查报告了他们对Asa的看法。为了分析的目的，只考虑相互作用本身。D. 迪波尔德语用学杂志204（2023）21E32244.3.参与者招募和人口统计参与者是通过研究人员的社交媒体渠道以及大学的实验平台招募的。因此，面试阶段的大多数参与者是大学本科生和研究此外，两位对聊天机器人开发有专业兴趣的专业人士也参加了采访。在问卷调查阶段，大多数参与者（45%）年龄在18至24岁之间，21.9%年龄在25至34岁之间，12.5%年龄在35至44岁之间超过70%的参与者称自己是白人，母语是英语。因此，参与者的人口统计数据总体上是相当同质的。虽然这不是一个明确提出的问题，但参与者的年龄表明，参与者可能非常熟悉数字媒介通信。5. 数据分析和结果5.1. 分析方法数据分析是探索性的，在项目开始时只有松散的理论指导然而，先前的研究主导的关于用户机器人对话的调查（参见文献综述）以及咨询主导的关于聊天机器人的工作（Dippold等人， 2020年），支持调查维修的必要性，以咨询对阿萨的可能改进。在定性分析软件程序（Nvivo）中对机器人交互数据和探索性注释进行初步阅读后，修复因此被选为分析中可能的重点5.2.分析阶段分析分四个阶段进行这些阶段不是一开始就预先确定的;相反，每一步都以前一步为指导，并增加了一层额外的证据。下面将详细讨论这些步骤中的每一个，然后通过示例更详细地探索结果。第1步：这一步的重点是识别用户自我修复的所有实例，发生在第二个位置，或者如果不成功，则发生在随后的转弯处。在大多数情况下（65），自我修复发生在一个回合后，其中阿萨启动修复。阿萨要么明确表示缺乏理解，要么提供一个转折，表明她试图理解导致了错误的解释。在极少数情况下，Asa会指出技术错误或根本不提供任何回应然后，后者导致自我启动的自我修复（7）。第二步：第二步的目的是识别导致其他人发起的用户自我修复的故障源这导致识别出四种不同类型的故障源（表1）：表1麻烦来源故障源示例计数选择：机器人提示信息的用户输入，例如，期望预约时间信息问题：用户发起信息问题，例如，关于手术2022年2月15日下午2点。24做MRI前我应该做什么？21请求：明确请求机器人哦不，原来我有另一个约会13一整天的话能改期吗？其他：例如，用户对理解的断言，用户自我披露，用户表达理解你好阿沙！我的名字姓氏8表1显示，导致机器人启动的用户自我修复的大部分故障源是由机器人最初提示的信息的用户输入。在频率上，下一个故障源是用户发起的信息问题，例如关于程序、停车信息等。第三个主要类别是用户对机器人的请求，例如，重新安排一个约会第三步：在这一步，所有用户自我修复的实例都根据用户在第二次和后续位置修复中如何进行自我修复进行了进一步分类由此确定了八项主要战略（见表2）：D. 迪波尔德语用学杂志204（2023）21E3225表2用户您可以正常饮食，并服用任何处方药●欢迎您带一个有任何其他问题或担心什么期待的一天？请回答是/否● 晚上（5 pm-8 pm）●任何时间（8am-8 pm）（接下页）自我修复策略和定义示例计数重新措辞：用户重新措辞自己的原始回合抱歉，我没听清。我还在学习请重新表述您提供的日期/时间？谢谢你，亚撒星期二最好42抱歉，我没听懂。你能换种说法吗？我能在星期二适应：用户调整他们的沟通行为以适应机器人做MRI前我应该做什么？抱歉，你想干什么我能帮上什么只需键入：*计划/重新安排*取消*41通过使用它的一个提示（参见：Giles和Ogay，2007年）。*我的预约 *- 查看您即将到来的预约*Prep*- 了解如何准备的信息为您的预约*常见问题解答*-为我们的常见问题解答页面*一般*-为一般信息（开放时间，电话号码，方向/地图等）*行政人员*-与医疗接待小组交谈Prep扫描时间为20至45分钟，您将保持完整着装●除非我们另行通知朋友或亲戚与您同行●您到达后，X光摄影团队会向您解释流程●您是否改变选择：用户改变他们最初做出的选择，例如，他们所期望的约会时间，在努力取得进展，互动早上页面出错了！检测到意外错误并报告给支持部门。请稍后再试，如果问题仍然存在，请联系管理员获取进一步的帮助。谢谢你，亚撒下午25页面出错了！检测到意外错误并报告给支持部门请稍后再试，如果问题仍然存在，请联系管理员获取进一步的帮助。谢谢你，亚撒重申目的：用户重申其请求的目的，例如，他们想预约请选择预约的日期和时间18：00 19：00无晚上7抱歉，我无法重新安排预约。请稍后再试，或尝试重新预订8不同的日期/时间。但是，如果您仍然面临问题，我可以将您与来自诊所来帮助你，只要打电话给某人。谢谢你，亚撒我是说19点你是说？Google*日历*我的预约链接*常见问题解答 *-常见问题问题重新启动*无*这些没有这些抱歉，请原谅。我还在学习你能换个说法吗？我能重新安排别担心请告诉我您想重新安排的预约号码1. 放映时间：2022年6月9日星期四19：00重复：用户重复原始项目我可以带一个朋友去约会你是说？*时间表*预约诊所的*位置*你是*欢迎* *没有*这些？8抱歉，我没听懂。你能换种说法吗？可以带朋友来吗？对不起，我还是不明白你的你想和我们团队的一员谈谈吗不了谢谢其他：例如，用户直接寻址机器人，用户的肯定或对机器人问题的非肯定回答残障通道对不起，我还是不明白你的你想和我们团队的一员谈谈吗是的请你想说什么*是*或*不是* *你好*犯了一个*错误* *没有*这些8更改主题：用户更改交互的主题/焦点你的预约是什么意思？查找*我的预约*诊所的 *位置**时间表 *预约*无*这些预约是为了什么？7抱歉，我没听懂。请再说一遍预约需要多长时间？对不起，我还是不明白你的问题。你想和我们队的人谈谈吗后期适应：用户调整他们的交际行为，好吧请选择一天中的首选时间：●上午（8am-12 pm）●下午（12 pm-5 pm）6机器人通过使用它的一个提示，尽管有多于转弯延迟。上午8抱歉，我无法重新安排预约。请稍后再试，或尝试重新预订不同的日期/时间。但是，如果你仍然面临的问题，我可以连接你的人从帮你解决问题的话，就跟别人说说话谢谢你，亚撒早上很抱歉，但在此日期没有剩余的可用时间段请指定其他日期。谢谢你，亚撒D. 迪波尔德语用学杂志204（2023）21E3226表2（续）自我修复策略和定义示例计数问：用户向机器人提问你觉得哪天合适6第一时间我很乐意协助预订，重新安排约会，你有一些在上面有哪些选择？我很乐意帮助您预订，重新安排，您可以在上面的菜单中找到更多选项表2显示了用户喜欢的修复策略的清晰层次：用户最经常重新表达他们的原始回合，但紧随其后的是适应，因为用户模仿机器人在前一回合提供的提示。其他策略包括用户改变他们原来的选择，大概是希望新的选择会被理解，重申他们原来请求的目的，并重复原来的回合。第4步：分析的最后阶段集中在用户自我修复后机器人响应的分类上。本研究的目的是确定用户的修复策略是否促进了交互。机器人的后续回合是根据Følstad和Taylor（2021）分析聊天机器人的定性框架进行编码的，其中添加了“无响应”的第五类（表3）：表3机器人响应分类。响应类型和定义Følstad和Taylor（2021）示例计数相关响应：该回合与用户消息相关。需要帮助我能帮上什么忙。只需键入：*计划/重新安排/取消*-至86管理约会*我的约会*-查看您的预约*准备*-了解如何为您的预约做好准备预约*常见问题解答*-我们的常见问题解答页面* 一般信息 *-一般信息（开放时间，电话号码，方向/地图等）*找人谈谈*-找医生谈谈接待团队误报：机器人错误地解释了用户的意图（误解）我觉得你没明白我的问题。你有一个一般的信息问题或问题，18预约还是程序？误报：机器人无法识别用户消息中的任何意图（缺乏理解）我是说19点你是说？Google*日历*链接我的预约*faq *-常见问题重新启动*无*这些47超出范围：机器人将用户解释为超出预期的聊天机器人范围。- 在数据中找不到--0无回应：对用户的维修转向在我将您连接到医疗接待团队之前，您可以在我们的患者MRI指南中找到一些有用的信息：https://bit.ly/3qCeMQV4还喜欢跟人说话是的是的喂？表3显示，在大多数情况下，用户修复导致相关的反应。在实践中，这意味着用户的意图往往在一次修复尝试和交互进展之后就被理解了。在其他情况下，用户修复导致错误的否定响应（47），其中机器人表示缺乏对用户转弯的理解，并且经常明确地请求修复。一个不太常见的类别是假阳性反应（18），表明误解用户的转折点。在少数孤立的情况下，用户维修回合根本没有收到任何响应（4），通常会促使自我启动自我修复。5.3.成功和不成功的修复在下一节中，我将介绍两组成对的例子作为案例研究。每一对都是从类似的故障源开始的。在每一对的一个例子中，用户的策略意味着交换的进展。另一方面，用户在解决误解方面面临困难。D. 迪波尔德语用学杂志204（2023）21E3227在前两个示例中，故障源是用户问题：实施例（1）1MRI扫描有害吗？2好的，哪天合适？3我在问做核磁共振扫描是否有害4你是说？需要*帮助* *谢谢*诊所的*位置* *没有*这些5没有这些6抱歉，我没听清。我还在学习你能重新表述一下你的日期/时间吗？7提供？谢谢你，亚撒8我可以预约星期四吗？9好吧请选择一天中的首选时间：●上午（8am-12 pm）●下午（12 pm-5 pm）●10晚上（5 pm-8 pm）●任何时间（8am-8 pm在示例（1）中，用户询问关于MRI扫描的问题（1. 1）。Asa以假阳性转向（l）回应。2)这表示误解并启动用户自我修复。用户重新表述原始问题（l。3），但这样做的“升级”的方式，使用额外的礼貌功能（预先请求“我问”）。在Asa表示缺乏理解后，在假阴性反应回合（l）中。4），用户使用Asa的提示之一，从而适应Asa（1. 5）。当这种适应策略也不成功并且机器人提出另一个修复请求时（l. 6e 7），用户改变主题（l. 8)其将交互进行到预订序列中，但留下未回答的原始问题。在示例（2）中，在一个回合中成功地实现了修复：实施例（2）1我穿什么衣服重要吗？2你想说什么*Prepare* for appointment google* calendar* link for my scheduled3预约诊所的*开放时间* *没有*这些4准备5●欢迎您6●请告诉我们任何特殊情况（例如，如果您7需要轮椅通道，如果你是重听，如果你有视力差，如果你是8幽闭恐怖症）你有任何其他问题或担心什么期待这里的麻烦源是关于预约准备的用户问题（l. 1）。这导致假阴性转向和修复启动，尽管Asa（l. 2e 3）。然后，用户通过使用所提供的提示中的一个来调节（1. 4），导致交换进展到关于即将到来的任命的信息第二对示例中的故障源是关于优选约会时间的用户输入实施例⑶12022年2月15日下午2点。2您的输入似乎与过去的日期和时间相似：01/02/2022 14：00 PM。请3重新措辞，更具体或指定不同的日期。谢谢你，亚撒415/02/2022 14：00 PM5你觉得哪天合适62022年2月15日7你觉得哪天合适8Admin9抱歉，我没听清。我还在学习你能换个说法吗10日期/时间输入？谢谢你，亚撒11Admin12抱歉，我没听清。我还在学习你能换个说法吗13日期/时间输入？谢谢你，亚撒14复位15好吧，让我们从头开始在示例（3）中，用户提供日期和时间输入（1. 1)这被Asa误解，Asa将用户选择的2月15日解释为2月1日（l. 2e 3）。用户随后重新表达他们的回合，以不同的格式提供他们的选择（1. 4）。这提示Asa再次启动修复（l. 5)并且用户进行另一次尝试来完成修复，这次仅通过提供期望的日期而不是时间（L）。6）。在Asa的下一次修复启动后（l。7）时，用户重复Asa的较早提示之一（admin8），这可以被描述为延迟适应，因为用户在交互中部署了Asa早些时候给出的提示然后，Asa再次启动修复（l。9e 10），并且用户尝试另一次修复（l.11），但这是再次失败。此时，用户选择不同的策略14），这导致进展到一个新的主题序列。实施例（4）1我想在下午3点2你是说？*一般信息* *谢谢你*需要*帮助* *没有 * 这些3没有这些4好吧请选择一天中的首选时间：●上午（8am-12 pm）●下午（12 pm-5 pm）●5晚上（5 pm-8 pm）●任何时间（8am-8 pm）D. 迪波尔德语用学杂志204（2023）21E32286下午7请选择时间13：00 14：00 15：00 16：00无813点可以9你好名字。我是阿萨，你的虚拟接待员很高兴确认您的筛选预约是10现在预订了2022年3月18日星期五13点的房间。这样可以吗示例4开始于用户选择他们期望的约会时间。这是嵌入在一个较长的，传统的间接请求，其中包括负面的礼貌标记（“我想”）（l.1）。在Asa的修复启动后，错误的否定响应包括提示（l）。2），用户适应这些提示之一（l.4）。这导致了进步，允许Asa提供一天中的时间选择菜单（l。4e 5）并随后导致成功的预约（l，6e 10）。表4自动修复后的Bot响应相关回应假阴性假阳性没有回应成功率重申目的8000100/0住宿27131066/34后期调节420067/33改变选择1555158/42重新措辞22146151/49转换话题430150/50问题132017/83重复161111/895.4.修复的成功因素到目前为止讨论的四个例子提供了初步了解用户部署的修复策略的范围。然而，在现阶段，它们还没有明确说明哪些战略最有可能取得成功。例如，通融可能是一种成功的策略，可以使人摆脱干扰（见例2、例4），但不一定普遍如此（见例3）。为了更多地了解在人机交互中导航干扰干扰的成功因素，我们将用户的策略选择与Asa的后续响应进行了交叉引用。表4显示了用户修复策略的成功率，表4显示，基于这个小数据集，一些自我修复策略的成功率高于其他策略。总体成功率最高的策略是简单地重申目的，尽管不是经常使用的策略这导致对每一个案件都作出了相关的反应住宿，晚住宿和改变选择也有超过50%的成功率。在所有的例子中，大约有一半的情况下，重新措辞和改变话题是最常用的策略之一，而简单地重复以前使用的话轮或问一个问题是最不可能成功的。通常，能够快速解决误解的用户（在故障源之后的一个或两个用户回合内）可以部署已被证明具有较高成功率的策略实施例（5）1做核磁共振前能吃东西吗2你想说什么*一般信息* *时间表*预约*准备*预约3*没有 *这些4为预约做5●扫描时间约为30分钟 ● *除非我们另行通知*，否则您可以吃喝6像平常一样，服用任何处方药●欢迎你7与您同行●您到达后，X光摄影团队将向您解释流程。8关于当天会发生什么的问题或担忧在示例（5）中，用户询问关于MRI扫描的问题（1. 1）。阿萨表示缺乏理解，这启动修复（l。2 e3）。然后，用户接受Asa的风格建议，重复她的一个提示（“准备好接受”，l。4）。虽然助理检察官随后的回答可能不是对问题的一个完全令人满意的回答，但它是一个相关的回答，结束了这个序列，并确保了进展。相比之下，使用成功率较低的策略的用户往往需要更加努力地工作，以了解他们的意图并确保进展：实施例（6）1请选择预约的日期和时间18：00 19：00无2晚上73抱歉，我无法重新安排预约。请稍后再试，或尝试重新预订D. 迪波尔德语用学杂志204（2023）21E32294不同的日期/时间。但是如果你仍然面临问题，我可以把你和某人联系起来。5帮你的话，就跟别人说吧谢谢你，亚撒6我是说19点7你是说？Google*日历*我的预约链接*常见问题解答 *-常见问题8问题重新启动*无*这些9没有这些10抱歉，请原谅。我还在学习你能换个说法吗？11我能重新安排12别担心请让我知道你想重新安排的预约号码：1。13放映时间：2022年6月9日星期四19：00在示例（6）中，故障源是用户的输入，其表示他们期望的约会时间（l. 2）。Asa的响应表明存在技术问题，但为用户提供了许多选项来进行交互（l. 3 e5）。用户通过重新表述其期望的预约时间来完成修复。重新措辞比他们以前的版本更罗嗦，“我的意思是”代表一个个人缓和类似于一个消极的礼貌标记（l。6）。在Asa的另一次维修请求之后（l。7e 8），用户改变策略，通过回收她的一个提示（l. 9）。当该策略也不成功时，用户的下一个自我修复重复最初的重新调度请求，这次将请求框定为有条件的间接请求11）。用户自我修复的第三次尝试导致相关响应，但迫使用户重新开始重新调度序列。6. 讨论6.1. 结果总结上一节中的分析通过对用户修复回合和后续机器人后续回合的定性和定量描述，显示了面向任务的聊天机器人中的用户如何在机器人不理解或不理解其意图时使用修复来克服干扰。它还表明，机器人Asa在其发展的这个阶段，经常无法适当地处理人类之间的口头社交互动所依赖的策略。当对Asa的修复启动做出反应时，用户会部署各种各样的自我修复策略。其中一些类似于面对面的社交互动，而另一些可能不那么类似，例如，改变最初的选择。最后，研究表明，用户最常使用的自我修复策略实际上是最不成功的策略之一，大约有一半的情况下会导致假阳性反应（误解意图）或假阴性反应（没有识别意图）。相反，重申目的的成功率很高，但用户很少使用。这有力地表明，用户将面对面的口头互动策略转移到与Asa的互动中(seeNass和Moon，2000年）。例如，如前所示，一些用户不仅改写了他们的原始回合，而且还用额外的礼貌标记来增强它们。这不仅反映了早期机器人研究中观察到的过度和过度发音策略（见文献综述），而且反映了以前在面对面互动中观察到的策略。例如，Kasper（2006）观察到，在随后的请求中，面试官在口头面试中使用礼貌标记Plug（2014）观察到，在自我启动的自我修复中，说话者通过更高的音高和更高的说话节奏进行韵律标记，Hauser（2019）观察到日本人互动的手势本研究中观察到的一些自我修复策略反映了这些模式。礼貌的“升级”是一种面对面交流的行为，还是其他需求的结果，还有待于进一步的研究。在这样做的过程中，“语用迁移”（Kasper，1992）的概念，传统上一直被用来描述L1语用策略到L2的迁移，并为跨文化，跨文化和语际语用的研究提供了大量的信息，也可以用于为人类与人工智能互动的研究提供信息。分析还揭示了进一步的见解，这些见解可能会影响用户与机器人的感知关系如图所示，然而，这种“用户与机器人交互中具体问题的确切关系需要进一步进行更详细的调查。另一方面，与“重述目的”一起然而，对这种策略的意识和使用它的准备程度可能取决于用户对聊天机器人的整体体验以及他们对人工智能工作原理的一般知识（Luger和Sellen，2016）。它也可能取决于用户对这些交互的总体取向：他们在多大程度上认为它们是“关系型”（关系型），还是“交易型他们在多大程度上认为他们具有人类特征（拟人化）（赫尔曼，2022）？总之，我们的分析表明，将“对话”一词应用机器人不仅不能适当地处理人类用户所依赖的策略，而且这里的修复机制也严重限制了用户的干预角色，使其只负责渐进性（参见Liebscher和D. 迪波尔德语用学杂志204（2023）21E32306.2.对AI技能的正如上面简要讨论的那样，我们在这里的目的是，为了有效地与人工智能驱动的聊天机器人进行互动，用户需要获得特定的技能，这些技能不一定反映面对面的口头互动。交际能力的一系列模型以前被用来描述社会交往所需的能力。例如，Canale和Swain（1980）将交际能力描述为四个组成部分：语法能力（词汇和规则）、社会语言能力（恰当性）、语篇能力（衔接和连贯）和策略能力（恰当地使用交际策略）。对用户-机器人交互中自我修复的分析表明，为了有效参与这些交互，其中三种能力尤为重要：社会语言能力：用户需要了解他们在与机器人交互时遇到的社会语言环境，以及这种环境对他们如何有效地使用语言来实现交易和关系目标意味着什么这项分析显示，一些用户不确定他们所处的社会语言环境：他们可能会通过使用机器人的提示来适应机器人，或者在延长的修复期后重申交互的目的，但也可以看到他们在用名字称呼Asa，并使用礼貌标记来减轻修复轮中的问题或请求这也表明，用户对于机器人作为机器或类似人类的机器人的取向是有冲突的（Waytz等人，2010年）。这个项目的发现表明，如果用户认识到聊天机器人的交互不应该被概念化为常规对话，而应该更多地被概念化为一组选项选择，这将是发展社会语言能力的重要一步。话语能力：用户需要能够评估他们使用语言的方式如何在用户-机器人交互中促进连贯的整体，以及使用语言的不同方式是否会导致不同的结果（参见传输过程，见文献综述）。例如，机器人如何处理和响应用户在特定请求中使用的语言，以形成有效的问答对，并进行交流？正如对用户-机器人交互的分析所示，用户知道哪些修复策略最有可能导致机器人理解他们的意图并触发相关响应是有用的战略能力：战略能力是人机交互中的误解修复的核心，因为它描述了防止误解并在发生误解时加以解决所需的技能。分析表明，战略灵活性可能是战略能力的最重要标准，反映了用户认识到问题已经发生以及为什么会发生的能力，深入挖掘他们的内部工具箱，并灵活地识别和部署替代战略。然而，鉴于融合是一个协作过程，只有当机器人的自然语言理解和生成框架允许并促进这一协作过程时，用户才能够充分部署其战略能力。总之，就像语用能力不一定与其他方面的交际能力一起发展一样（Kasper和Roever，2005），对话AI的沟通技能并不是所有AI用户天生的（Luger和Sellen，2016）。这表明明确教授这些技能并帮助用户了解他们所处的社会语言环境是有价值的。有效参与对话式人工智能的教学技能方法将受益于包括先前描述的用于发展沟通能力的所有工具（例如，Jones and Stubbe，2004 forprofessional communication; Dippold，2015for classroom interaction），如提高意识、体验式学习、反思。事实上，Howard（2012）的CMC技能教学范式包括所有这些元素。Weisz等人“S（2019）关于成功的人机交互教学策略的实验说明也是这样做的，除了一个教学阶段，重点是提高用户的同情心，并理解为什么机器人可能难以处理用户输入。在这项研究中，教学干预导致用户报告说，他们已经制定了更好的策略（例如，使用简单的语言，精确地指定意图）。用户还发展了他们对算法思维过程的理解，并学会了将其能力与人类能力区分开来。6.3.局限性和未来研究这项研究有一些局限性。首先，这里分析的数据是作为一个以用户体验为中心的试点项目的一部分收集的，该项目的机器人产品处于开发的非常阶段，尚未从自己的交互中学习。因此，这里的机器人响应不一定反映其处理用户意图和启动修复的全部未来能力。其次，如前所述，本文的数据是从代表机器人用户相对较小的人口统计学子集的用户中收集的，其中大多数用户的年龄可以假设对AI聊天机器人有一定的熟悉度。这可能会扭曲这里报告的用户修复结果。因此，在更广泛的人口统计样本中，人们会认为对聊天机器人所代表的社会背景的熟悉程度更低而不是更高。在未来的研究中，对会话AI熟悉程度高和熟悉程度低的用户进行用户修复的比较研究将是非常有趣的。最后，本文所基于的数据集是一个相对较小的用户-机器人交互语料库。有必要进一步研究更大的数据集，以进一步证实这里报告的模式理想情况下，这还应包括收集的数据●●●D. 迪波尔德语用学杂志204（2023）21E3231而不是在模拟环境中。当有更多的风险时，用户他们坚持尝试修复的次数或他们选择的策略分析提供了更多的见解，后续研究现在可以进一步评估。例如，在观察到用户将语用策略从口语交互转移到机器人交互的基础上，进一步的研究可以探索在什么情况下发生这种转移，以及哪些用户群体最有可能参与这种转移。第二，进一步的研究可以询问使用者的修正策略如何与他们对融洽关系的期望和他们的语言使用意识形态相关联回顾性访谈详细询问用户在与聊天机器人交互时的决策过程，有可能能够挖掘这些问题。最后，将感兴趣的是探索用户是否响应于未精确定位故障所在的开放式修复请求和更精确定位故障的封闭式格式而不同地完成修复（Dingemanse等人， 2014年）。这是Ashktorab et al. s（2019）对机器人修复策略的用户偏好的调查已经被利用（见文献综述），但进一步的调查超出了本文的范围。此外，当然也有必要扩大我们的视野，使之无法修复。在我的分析过程中，非正式的观察表明，用户在交易型机器人交互中的成功还取决于其他因素。许多麻烦的来源，例如最初的用户意图表达在较长的，话语轮。因此，一个有趣的后续问题是，在多大程度上意图识

下载后可阅读完整内容，剩余1页未读，立即下载