第 2 章 技术综述
2.1 facet 分类方法
2.1.1 介绍
分面搜索起源于都灵大学的信息系,是计算机科学家、信息科学家、界面设计者、
可用性研究人员都感兴趣的一个话题。分面(Facet)一词在国内信息组织领域一般被翻
译为分面,分面是指事物的多维度属性,例如一件衣服包含款型、价格、尺码等分面。
而分面搜索是指不断筛选经过事物的这些属性并过滤搜索结果,可以将分面搜索看作
是搜索与浏览的结合。人们看待事物的角度是不一样的,分面为这种多维角度的认知
提供了支持,分面划分的思想在企业搜索、信息架构、交互界面设计、多维数据库等
多个领域都有用处。分面搜索作为一种有效的搜索方式,已经被用在电子商务、音乐、
旅游等多个方面。也有人认为分面是语义的初级阶段,分面的方式可以看作是语义搜
索的一种类型,充分揭示和表达关系。事实上,这种探索式访 问适用于及其广泛的实
际情况,例如在 “在线信息访问系统”分面搜索已经越来越流行了,尤其是在电子商
务和网站搜索应用方面。如电子政务、多媒体数据库、数字图书馆、软件开发等领域。
分面搜索有效提高了信息检索的效率,改善了用户体验,对于交互式信息检索的
研究既有一定的理论价值,又有重要的实践意义。
使用分面搜索 (Faceted Search)之后的结果是上下文相关的,用户选择某个条件后,
会动态获取在该条件限定下的结果集的分面结果中,为了能够进行分类,从不同的角
度对数据的整合,以帮助用户了解数据信息。在查询过程中,用户对导航面可以进行
灵活地切换;能解决查询结果为空集这一难题是分面搜索的另一个显著优点,并且改
善了用户体验。分面搜索的优势可以归纳为以下 3 点:首先,分面搜索支持用户根据
自己的需要选取不同的分面进行筛选,而不必根据网站预先设定的单一方式寻找;其
次,分面搜索允许用户创建自己的搜索路径,并且可以对结果范围随时进行扩大和缩
小;最后,面搜索结果只显示一个相应的选项,以避免结果为空的情况。并且一般在
搜索前提示用户该选项内包含的结果数量,给用户良好的操作前提示。
建立一个分面搜索系统的关键问题是选择什么样的面和值来让用户随时可用。当
文件涉及范围非常广的时候,这个问题尤其重要。一些系统显示给用户所有可能的分
面值。这种方法会很快淹没用户,从而削弱用户属性。其他的系统如 eBay Express,显
示了一个手动选择面的子集,和基于他们的频率的分面一值 (Facet—Values)排名。其
他的系统如 Flamenco,简单地按字母表顺序排列的前几个分面一值来显示。对于有很
多面的系统来说,手动选择和维护分面太费时。而且一个预先定义的界面不能满足所有
用户的需求。需要的是一个自动选择面和值的机制,根据用户行为向用户显示,在一
次搜索中,使预期的效用最大化。