Markov网页预测模型综述网页预测模型综述
介绍了基本的Markov浏览预测模型;讨论了扩展的Markov浏览预测模型,包括隐Markov模型、多Markov模
型、混合模型、结构相关性模型;综述了各个模型的算法及其优缺点;分析了Markov浏览预测模型需要深入研究
的问题。
摘摘 要:要: 介绍了基本的Markov浏览预测模型;讨论了扩展的Markov浏览预测模型,包括隐
关键词:关键词:
建立有效的用户浏览预测模型,对用户的浏览做出准确的预测,是导航工具实现对用户浏览提供有效帮助的关键。
在浏览预测模型方面,很多学者都进行了卓有成效的研究。AZER[1]提出了基于概率模型的预取方法,根据网页被连续访问
的概率来预测用户的访问请求。SARUKKAI[2]运用马尔可夫链进行访问路径分析和链接预测,在此模型中,将用户访问的网
页集作为状态集,根据用户访问记录,计算出网页间的转移概率,作为预测依据。SCHECHTER[3]构造用户访问路径树,采
用最长匹配方法,寻找与当前用户访问路径匹配的历史路径,预测用户的访问请求。XU Cheng Zhong等[4]引入神经网络实现
基于语义的网页预取。徐宝文等[5]利用客户端浏览器缓冲区数据,挖掘其中蕴含的兴趣关联规则,预测用户可能选择的链
接。朱培栋等人[6]按语义对用户会话进行分类,根据会话所属类别的共同特征,预测用户可能访问的文档。
在众多的浏览模型中,Markov模型是一种简单而有效的模型。Markov模型最早是ZUKERMAN[7]等人于1999年提出的一种
用途十分广泛的统计模型,它将用户的浏览过程抽象为一个特殊的随机过程——齐次离散Markov模型,用转移概率矩阵描述
用户的浏览特征,并基于此对用户的浏览进行预测。之后,BOERGES[8]等采用了多阶转移矩阵,进一步提高了模型的预测
准确率。在此基础上,SARUKKAI建立了一个实验系统[9],实验表明,Markov预测模型很适合作为一个预测模型来预测用户在
Web站点上的访问模式。
1 Markov模型模型
1.1 Markov模型模型
Markov预测模型[10]对用户在Web上的浏览过程作了如下的假设。
假设1(用户浏览过程假设):假设所有用户在Web上的浏览过程是一个特殊的随机过程——齐次的离散Markov模型。即设离
散随机变量的值域为Web空间中的所有网页构成的集合,则一个用户在Web中的浏览过程就构成一个随机变量的取值序列,
并且该序列满足Markov性。
一个离散的Markov预测模型可以被描述成三元组<S,A,B>,S代表状态空间;A是转换矩阵,表示从一个状态转换到另一
个状态的概率;B是S中状态的初始概率分布。其中S是一个离散随机变量,值域为{x1,x2,…xn},其中每个xi对应一个网页,
称为模型的一个状态。
Markov预测模型是一个典型的无后效性随机过程,也就是说模型在时刻t的状态只与它的前一个时刻t-1的状态条件相关,与
以前的状态独立。即: