旅行场景下搜索技术的应用与创新:从猪搜到个性化推荐

版权申诉
0 下载量 141 浏览量 更新于2024-07-05 收藏 2.67MB PDF 举报
"该文档主要探讨了在旅行场景下搜索技术的应用与创新,特别是阿里飞猪平台的全局搜索(猪搜)系统。文档分为四个部分:猪搜背景、基础建设、召回策略和思考总结。猪搜是飞猪平台的核心功能,它不仅包括全局搜索,还覆盖了酒店、机票、度假等特定行业的搜索,满足用户跨类目的旅游决策需求。同时,猪搜承担着在手淘中引导用户并提供最快速操作路径的任务。 在猪搜的框架中,涉及到了多个关键技术环节,如Query Processing (QP)、搜索服务、Language Understanding Platform (LTP)、Search Platform (SP)、HA3、索引查询、粗排、CTRCVRSCORE、ITEMSTATICSCORE、MATCHSCORE、加权排序以及RTP等。这些环节共同构成了从用户输入到返回结果的整个搜索流程。 文档指出,猪搜面临着多方面的挑战,包括性能优化以提供良好的在线服务体验、传统文本理解以增强文本相关性、LBS(Location-Based Services)和POI(Point of Interest)的理解来提供空间相关性,以及用户特征的理解以实现个性化推荐。 QueryTagging是QP中的关键任务,用于识别用户查询的意图。这个过程涉及应用层、算法层和数据层,通过预处理、分词、词表预匹配和消歧规则/模型来实现。此外,文档还介绍了商品POI(Point of Interest)的挖掘,这是一个从非结构化的HTML商品详情中提取景点信息的过程,通过人工+词库标注、CRF++模型和命名实体识别(NER)技术,实现了99.3%的准确率和95.2%的召回率。 最后,文档提到了同义词挖掘的问题,特别是在航旅领域的四种类型同义词挖掘的挑战,即如何在一个模型中建模这四种关系,以挖掘通用的同义词。这里提到了基于词向量的方法,但未给出具体细节。" 这篇摘要涵盖了旅行场景下搜索技术的关键点,包括搜索系统架构、面临的挑战、QueryTagging和POI挖掘的技术实现,以及同义词挖掘的初步概念。