简述简述Markov网页预测模型网页预测模型
建立有效的用户浏览预测模型,对用户的浏览做出准确的预测,是导航工具实现对用户浏览提供有效帮助的关
键。 在浏览预测模型方面,很多学者都进行了卓有成效的研究。AZER提出了基于概率模型的预取方法,
根据网页被连续访问的概率来预测用户的访问请求。SARUKKAI运用马尔可夫链进行访问路径分析和链接预
测,在此模型中,将用户访问的网页集作为状态集,根据用户访问记录,计算出网页间的转移概率,作为预测
依据。SCHECHTER构造用户访问路径树,采用长匹配方法,寻找与当前用户访问路径匹配的历史路径,预测
用户的访问请求。XU Cheng Zhong等引入神经网络实现基于语义的网页预取。徐宝文等利用客户端浏览器
建立有效的用户浏览预测模型,对用户的浏览做出准确的预测,是导航工具实现对用户浏览提供有效帮助的关键。
在浏览预测模型方面,很多学者都进行了卓有成效的研究。AZER提出了基于概率模型的预取方法,根据网页被连续访问
的概率来预测用户的访问请求。SARUKKAI运用马尔可夫链进行访问路径分析和链接预测,在此模型中,将用户访问的网页
集作为状态集,根据用户访问记录,计算出网页间的转移概率,作为预测依据。SCHECHTER构造用户访问路径树,采用长
匹配方法,寻找与当前用户访问路径匹配的历史路径,预测用户的访问请求。XU Cheng Zhong等引入神经网络实现基于语义
的网页预取。徐宝文等利用客户端浏览器缓冲区数据,挖掘其中蕴含的兴趣关联规则,预测用户可能选择的链接。朱培栋等人
按语义对用户会话进行分类,根据会话所属类别的共同特征,预测用户可能访问的文档。
在众多的浏览模型中,Markov模型是一种简单而有效的模型。Markov模型早是ZUKERMAN[7]等人于1999年提出的一种
用途十分广泛的统计模型,它将用户的浏览过程抽象为一个特殊的随机过程——齐次离散Markov模型,用转移概率矩阵描述
用户的浏览特征,并基于此对用户的浏览进行预测。之后,BOERGES等采用了多阶转移矩阵,进一步提高了模型的预测准确
率。在此基础上,SARUKKAI建立了一个实验系统[9],实验表明,Markov预测模型很适合作为一个预测模型来预测用户在Web
站点上的访问模式。
1 Markov模型模型
1.1 Markov模型模型
Markov预测模型对用户在Web上的浏览过程作了如下的假设。
假设1(用户浏览过程假设):假设所有用户在Web上的浏览过程是一个特殊的随机过程——齐次的离散Markov模型。即
设离散随机变量的值域为Web空间中的所有网页构成的集合,则一个用户在Web中的浏览过程就构成一个随机变量的取值序
列,并且该序列满足Markov性。
一个离散的Markov预测模型可以被描述成三元组<S,A,B>,S代表状态空间;A是转换矩阵,表示从一个状态转换到另
一个状态的概率;B是S中状态的初始概率分布。其中S是一个离散随机变量,值域为{x1,x2,…xn},其中每个xi对应一个网
页,称为模型的一个状态。
Markov预测模型是一个典型的无后效性随机过程,也就是说模型在时刻t的状态只与它的前一个时刻t-1的状态条件相关,
与以前的状态独立。即: