虚拟调酒师：结合数据驱动和知识推荐的对话系统

42 浏览量更新于2023-09-05 收藏 12.83MB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

0虚拟调酒师：结合数据驱动和基于知识的对话系统0基于知识的推荐0Knut Hinkelmann，Monika Blaser，Oliver Faust，Alexander Horst，Carlo Mehli0瑞士西北应用科学与艺术大学FHNW，瑞士奥尔滕市Riggenbachstrasse16，4600，knut.hinkelmann@fhnw.ch；{monika.blaser|oliver.faust|alexander.horst|carlo.mehli}@students.fhnw.ch0摘要0本研究涉及数据驱动和基于知识的推荐的结合。该研究是在威士忌推荐的应用场景中进行的，客人与推荐系统进行对话。关于口味的偏好很难表达，关于口味的知识是隐性的，因此很难恰当地表示和使用。人们不知道如何用标准化的方式描述口味以及如何做出合理的选择。这是因为关于口味的知识主要是隐性知识。为了处理这种知识，数据驱动的推荐是适当的。另一方面，特别有经验的顾客使用关于酿酒厂、地点和酿酒过程的知识来表达他们的偏好，并希望对推荐的产品有理由。这表明在隐性知识和显性知识都可用的领域中，数据驱动和基于知识的推荐的结合是适当的。0介绍0推荐系统是提供给用户的一种软件工具和技术，用于提供有用的物品建议。这些建议涉及各种决策过程，例如购买哪些物品，听什么音乐，或阅读什么在线新闻（Ricci等，2011年，第1页）。推荐系统在亚马逊、YouTube、Netflix、LinkedIn、Face-book、Tripadvisor、Last.fm和IMDb等受欢迎的互联网站中起着重要作用（Ricci等，2015年）。许多不同的产品，如书籍、电影、音乐等，都是由推荐系统推荐的，而社交平台也使用推荐系统来扩展朋友或商业联系人的社交网络（Aggarwal，2016年）。0与应用领域存在显著差异的是，在对话中进行推荐的场景。0版权由作者保留。在A. Martin，K. Hinkelmann，A. Gerber，D. Lenat，F.van Harmelen，P. Clark（Eds.）主编，《AAAI 2019会议论文集》0在推荐系统和客户之间存在一定差距。想象一下对一顿饭的葡萄酒推荐。这些场景的典型特点是上下文决定了推荐（Ado- mavicius等，2011年），或者关于客户的信息不足。0可以基于数据或知识进行推荐。我们分析了一个应用领域，并表明数据驱动和基于知识的推荐的结合是最合适的。我们根据数据的可用性、知识的类型和用户交互推导出了这两种方法的结合的标准。0文献综述0在文献综述中，我们讨论了对话式推荐系统设计相关的几个主题。首先，我们区分了不同类型的推荐系统。然后，我们讨论了不同类型的知识及其对数据驱动和基于知识方法之间的选择的影响。0推荐系统的类型0存在不同类型的推荐系统（Burke，2007年）。其中一种区别是数据驱动和基于知识的技术。协同过滤、内容推荐和人口统计推荐是数据驱动的系统。协同过滤仅使用不同用户的评分信息生成推荐。内容推荐器通过将用户的评分信息与产品特征相结合来学习分类器。人口统计推荐器根据用户的人口统计信息提供推荐。所有这些数据驱动的技术都存在冷启动问题或首次评分者问题。它们需要一定量的数据才能提供有价值的结果。0与知识工程相结合的机器学习研讨会（AAAI-MAKE2019）。美国加利福尼亚州帕洛阿尔托斯坦福大学，2019年3月25-27日。 0基于数据的技术存在冷启动问题或首次评分者问题。它们需要一定量的数据才能提供有价值的结果。0基于知识的推荐系统根据对用户需求和偏好的推断来建议产品。基于知识的推荐系统有时被列为内容推荐系统的一个独立类别（Aggarwal，2016年，第16页），但它们也可以包含关于某些产品特征如何满足用户需求和偏好的显式领域知识（Burke，2007年）。因此，选择数据驱动和基于知识的推荐系统的一个标准是数据和知识的可用性。0知识为基础的系统的使用0除了数据可用性或稀疏性等与技术相关的问题外，还存在人为因素，例如推荐系统与人类之间的理想交互以及对此类系统的接受程度。不考虑这些人为因素可能导致消费者更喜欢人类而不是机器的推荐（Yeo- mans等，2008年）。0在对话式环境中，推荐是由人类和应用程序共同创建的。用户可能会要求解释推荐的依据，这要求基于推荐的知识以人们可以理解的方式进行表示。这可以通过基于知识的系统实现，其中知识被明确地表示。因此，在这种情况下，基于知识的推荐系统似乎比依赖统计数据或用神经网络以子符号方式表示知识的数据驱动方法更可取。0知识类型0构建基于知识的系统意味着获取知识并以可以自动执行的方式进行表示。这个创建知识库的过程称为知识工程。0从知识管理的角度，我们知道有不同类型的知识（见图1）。第一个区别是隐式知识和显式知识。隐式知识存在于人们的脑海中，而显式知识则是外部化的。对于隐式知识，可以进一步区分为隐性知识和自我意识知识。隐性知识由Polanyi（1966）引入并进行了深入研究。0图1 知识类型0从显式知识中构建知识库意味着将其转化为形式化的表示（图2）。隐式知识在形式化表示之前必须首先变为显式知识。处理隐式知识的一种方法是从数据中学习，而不是从人类获取。对于推荐系统来说，这意味着应用数据驱动的方法。通过从购买行为数据中提取顾客的偏好来进行推荐。0图2 知识工程和学习0通过分析我们可以看到，在基于对话的应用中，基于知识的推荐系统对人机交互更优。然而，并不是所有的知识都以显式形式存在。本研究的目标是研究数据驱动方法和基于知识方法如何结合应用于推荐系统。0应用场景0推荐那些虽然在专业领域内有专家提供服务，但却很难描述的物品。例如，葡萄酒或威士忌的味道，或者香水的气味很难描述。这些领域没有标准的词汇，选择“正确”的产品取决于个人偏好。另一方面，这些领域也有专家存在。例如，葡萄酒专家可以根据葡萄、产区和年份评估葡萄酒的质量和口感。在我们的研究中，我们研究威士忌的推荐。我们的愿景是开发一个虚拟调酒师。0选择适当的威士忌主要取决于口感。为了了解专家在推荐威士忌时如何进行，我们采访了一位专业酒保。采访结果允许绘制出可能的威士忌推荐对话的简要流程（见图3）：在进行一些闲聊之后，她试图快速了解顾客的经验水平。如果顾客没有经验，她会选择一些甜味较浅、轻度烟熏且价格不太昂贵的威士忌。如果顾客熟悉威士忌，她会询问他们的口味偏好，然后做出相应的推荐。 0推荐之后，顾客会给出反馈，这会影响下一次的推荐。0图3 威士忌推荐流程0描述威士忌的口感是困难的。为了展示这种多样性，我们分析了苏格兰麦芽威士忌协会的威士忌描述。这里有一些例子：0•"口腔被热带水果（香蕉、凤梨、猩猩）的阳光洗礼所沐浴-极其甜美、令人垂涎欲滴，但夹杂着胜利V和盐和胡椒薯片的味道，提醒我们它在橡木桶中陈酿了很久。"0•"空气中弥漫着太妃糖、葡萄干、枣、巴西坚果、意大利香醋和浓郁的玛姆西马德拉葡萄酒的气息。在味蕾上，我们品尝着甜蜜、咸味和辣味的烤坚果，与朋友们聊天、分享欢笑和饮品0•"我们在灌木丛中采摘浆果，喝着蔓越橙香槟鸡尾酒，蒸馏檀香木油。在口中，它就像加勒比黑蛋糕一样，一块浸泡在朗姆酒中的果蛋糕，夹杂着适量的甘蔗糖浆、红糖和烤糖汁。加水后，呈现出抛光的红木色，带有甜美的没药香和咸甘草，接着是富有活力的印度酸酱和浓郁的黑蜂蜜香草玉米面包。"0有许多方法来对威士忌的口感进行分类。已经识别出超过400个香气和口味描述词，并将其分为12个感官特征，从中开发出威士忌口味的分类（Wishart，2000）。然而，这些特征的价值是有限的，因为大多数威士忌消费者对此一无所知或知之甚少。0对于描述他们所期望的威士忌口感的正确术语，顾客常常缺乏理解（Mead & Matarić，2009）。0为了应对各种各样的口味，苏格兰麦芽威士忌协会将其分为12个味0• 年轻而活泼0• 甜美，果香和醇厚0• 辣味与甜味0• 辛辣和干燥0• 深厚、丰富和干燥0• 古老而庄严0• 轻盈而细腻0• 多汁，橡木和香草0• 有油性且海洋风味0• 轻度烟熏0• 烟熏0• 强烟熏0每个特征都有一个简短的描述（见图4）。0图4 味道特征描述（www.smw.org）0虽然很难想象一个系统能够处理如此多样的口味描述，但将其分类为12个特征并不会在推荐富有复杂口感的威士忌时取得成功的结果。0在推荐过程中，酒保试图了解顾客的偏好。对话的内容根据顾客的知识水平而不同。这就是酒保的专业知识的作用所在。除了口感，酒保还可以运用自己对酒厂和蒸馏程序的知识。威士忌的特征非常复杂，受到许多因素的影响，比如酒厂的位置（水源质量，州的法规，酒桶的暴露情况），谷物配方以及蒸馏设备的大小和数量（Lapointe &Legendre，1994）。对威士忌产区的一般知识可以初步了解威士忌的特征。例如，Lagavullin和Ardbeg是位于Islay的酒厂，Islay的威士忌通常有烟熏味。0酒保还可以运用有关蒸馏过程的知识。对于结尾，威士忌可以在不同的桶中重新装填。桶的以前使用情况，例如用于雪利酒或波特酒，会改变威士忌风味的特点。0所有这些知识使得酒保能够与顾客进行对话，并向经验丰富的顾客解释推荐结果。 0图5 苏格兰的威士忌产区0基于对话的威士忌推荐系统0我们的研究目标是分析哪些推荐方法适用于基于对话的推荐系统。根据Mead &Matarić（2009）的说法，基于内容的推荐的成功通常取决于两个重要的领域属性：（1）需要使用明确定义的特征来描述物品；（2）用户必须对这些特征及其与需求的关系有一定的理解。0从应用场景分析和与经验酒保的访谈中得出，数据驱动和基于知识的推荐结合起来是最合适的。关于口感的知识无法适当地表达出来，因此被归类为隐性知识。Tiwana（2000）已经表明，将这种知识明确化是不合适的。因此，使用协作和基于内容的过滤，根据数据自动确定适合的威士忌。0•然而，推荐系统必须考虑到顾客无法充分表达他们的偏好。这就是应用基于知识的推荐的地方，它使用关于典型口味和偏好的知识。0聊天机器人使用基于知识的方法来引导对话以获取缺失的用户输入。这种来自聊天的输入对于了解个人威士忌偏好非常重要。0特别是经验丰富的顾客更喜欢谈论他们的偏好和经历，并期望对推荐的解释有合理的理由。0基于推荐的知识分析使我们能够将不同的推荐方法分配给不同的步骤。这些在流程模型中用不同的颜色表示（图6）。基于内容的推荐是橙色的，协作过滤是黄色的，基于知识的推荐是绿色的。有一些流程步骤可以使用几种或者不同的推荐方法。例如，对于经验不丰富的威士忌饮用者，决策仅可以基于其他人的选择（协作过滤），也可以考虑到酒保关于适当威士忌属性的猜测（基于内容的推荐）。在模式中选择最合适的推荐方法是为了给出一个不同推荐方法组合的印象。0图6 威士忌推荐过程中的推荐技术0原型开发0为了验证这一发现，我们开发了两个聊天机器人的版本。第一个版本主要侧重于基于内容的过滤，只使用简单的知识库。评估使用了Lapointe和Legendre（1994）的威士忌数据集，其中包含100多种威士忌和84个属性。为了适应推荐过程，我们添加了一个价格属性并删除了一些属性。 0几乎无法表达的属性。为了支持初始对话，数据集中的每种威士忌都包含了一个背景故事。0聊天机器人是使用dialogflow实现的。一个Web服务生成用户偏好向量，计算与数据集中每种威士忌的相似性并更新后端信息。下图显示了一个示例对话。0图7 推荐对话的截图0这个第一个原型只使用了一个非常简单的知识库。为了理解基于知识和数据驱动推荐的适当组合，我们开发了第二个原型。0两种方法用于在混合系统中结合不同的推荐方法。在并行组合中，通过计算加权平均值来组合不同推荐系统的结果（称为混合化）。0顺序组合允许将不同的推荐系统应用于特定的子任务，使用一个方法的输出作为下一个方法的输入。这种方法对威士忌推荐非常重要，因为基于知识的和数据驱动的推荐具有不同的优势并利用不同类型的知识。此外，在对话式方法中，结合“询问”和“提议”两种策略强调了顺序方法的决策。0将基于知识的推荐（通过问询在对话中获得的知识）与基于内容的推荐（关于客户已知信息的推荐）相结合。0推荐的对话可能由不同的通信片段和问题组成。基于知识的方法允许灵活的对话。与每个客户询问相同问题不同，知识库通过对话片段引导聊天机器人，具体取决于已经了解的客户信息。图8显示了回头客户和新客户的对话流程。0图8 回头客和新客户的沟通流程0聊天机器人的以下展示展示了内容推荐和基于知识的推荐如何结合在一起。如果客户开始与机器人聊天，它会要求姓名，从而知道这个人是回头客还是新客户。然后会询问当天的喜好。在图9的示例中，客户想喝一些烟熏的威士忌，数据库返回了12种烟熏的威士忌。由于我们已经知道了这个人喜欢的其他味道（基于内容），机器人可以询问价格范围以及这个人是否想尝试与上次完全不同的东西或者更类似于饮酒历史的东西。这减少了匹配威士忌的数量，然后客户可以在前两种威士忌之间进行选择。推荐和客户的饮酒历史的反馈保存在数据库中。 0图9 与回头客的对话0结论0两个聊天机器人针对有经验和无经验的威士忌饮用者进行了评估。研究表明，在基于对话的表示中，数据驱动和基于知识的推荐的组合是合适的。需要知识与客户进行对话。特别是有经验的客户希望表达他们的偏好，并希望对推荐的产品有理由。然而，对于像葡萄酒或威士忌这样的产品，很难表达。人们不知道如何以标准化的方式描述风味和做出合理的选择。这是因为关于味道的知识主要是隐性知识。为了处理这种知识，数据驱动的推荐更为适用。0因此，基于知识和数据驱动的推荐的组合对于对话式推荐系统是有用的。0参考文献0Adomavicius, G., Mobasher, B., Ricci, F., & Tuzhilin, A. (2011).上下文感知推荐系统. AI Magazine, 秋季, 67-80。Aggarwal,Charu C. (2016). 推荐系统. Cham, Hei- delberg, New York,Dordrecht, London: Springer international Publishing AG.Bridge, D., & Stuckenschmidt, H. (2017). 电子商务和Web技术.Cham: Springer International Publishing AG Polanyi, M. (1966).隐性维度 (2009年版，Amartya Sen写的新前言). 芝加哥和伦敦:芝加哥大学出版社. Jannach, D., Zanker, M., Felfernig, A., &Friedrich, G. (2010). 推荐系统导论. 剑桥大学出版社. Lapointe,F.-J., & Legendre, P. (1994). 一种纯麦芽威士忌的分类.皇家统计学会杂志.C系列(应用统计学), 43(1), 237-257。0梅德, R.，Matarić, M. J. (2009). 暗示的力量.人机交互国际会议论文集- HRI’09，(5月)。Ricci, F., Rokach, L., &Shapira, B. (2015). 推荐系统手册. Springer-Verlag (第二版). 纽约:Springer Business+Science Media LLC. Tiwana, A. (2000).知识管理工具包：建立知识管理系统的实用技术.美国新泽西州上索德河: Prentice Hall PTR. Sohail, S. S., Siddiqui,J., & Ali, R. (2012). 电子商务的产品推荐技术-过去，现在和未来.计算机工程与技术高级研究国际期刊(IJARCET)，1(9). Viappiani, P.,Faltings, B., & Pu, P. (2006).基于偏好的搜索，使用示例批判和建议.人工智能研究杂志，27(1)，465–503。Wishart, D. (2000).单一麦芽威士忌的分类. 在H. A. L. Kiers，J.-P. Rasson，P. J. F.Groenen和M. Schader (Eds.)的数据分析，分类和相关方法(pp.89–94). 柏林，海德堡: Springer. Yeomans, M., Shah, A. K.,Mullainathan, S., & Kleinberg, J. (2008). 理解推荐的意义. 剑桥:哈佛大学经济学系

下载后可阅读完整内容，剩余1页未读，立即下载