状态空间模型与概率矩阵分解结合的推荐算法

需积分: 15 39 浏览量更新于2024-08-13 收藏 1.33MB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

"基于状态空间模型和概率矩阵分解的推荐算法" 本文提出了一种结合状态空间模型和概率矩阵分解的新型推荐算法，旨在解决传统矩阵分解方法在处理用户兴趣漂移时的不足。传统的矩阵分解算法通常一次性处理所有训练数据以获取用户兴趣特征，但这种做法忽视了用户兴趣随时间可能发生变化的现象，即用户兴趣漂移问题。状态空间模型在这里被用来动态地捕捉用户兴趣的变化。具体来说，用户兴趣特征向量和用户评分数据的矩阵分解被映射到一个线性高斯状态空间中。状态空间模型的优势在于它能够对动态系统进行建模，适配用户兴趣随时间演变的情况。在模型构建过程中，论文采用了期望最大化（EM）算法来估计模型参数。EM算法是一种在有隐藏变量的情况下估计统计模型参数的有效方法，它可以处理不完全观测的数据。通过EM算法，可以逐步优化模型，使得数据和模型之间的拟合度达到最优。进一步，论文利用卡尔曼滤波器对模型参数进行动态求解。卡尔曼滤波器是一种在存在噪声的动态系统中估计状态的最优方法，它能够结合先验知识和新观测数据，给出最可能的状态估计。在这个推荐系统中，卡尔曼滤波器可以帮助实时更新用户兴趣特征向量，以适应兴趣漂移。在算法执行的最后阶段，通过比较前后两次获得的用户兴趣特征向量，可以判断用户兴趣是否发生了漂移。如果发现漂移，推荐系统会据此调整其推荐策略，以提供更准确的个性化推荐，从而提高推荐质量。实验结果显示，与传统的矩阵分解推荐算法相比，这种基于状态空间模型和概率矩阵分解的方法在感知用户兴趣漂移方面表现出色，能够显著提升推荐的准确性。这表明，结合动态模型和概率方法对于处理用户兴趣随时间变化的推荐问题具有显著优势。关键词：矩阵分解，状态空间模型，EM算法，卡尔曼滤波这篇研究工作得到了国家自然科学基金和国家创新群体项目的资助，由曹玉琳和李文立共同完成。曹玉琳是论文的主要作者，专注于数据分析和推荐系统的研究；李文立则是一位专注于社会网络分析的教授和博士生导师。他们的研究对于推荐系统的改进和发展提供了新的理论和技术支持。

资源详情

资源推荐

收稿日期：２０１９０８０８；修回日期：２０１９０９２４　　基金项目：国家自然科学基金资助项目（７１８７４０２２）；国家创新群体项目（７１４２１００１）

作者简介：曹玉琳（１９８０），男（通信作者），辽宁大连人，博士，主要研究方向为数据分析、推荐系统（ｄｕｔｃａｏｙｕｌｉｎ＠１６３．ｃｏｍ）；李文立（１９６９），

男，河南平顶山人，教授，博导，博士，主要研究方向为社会网络分析．

基于状态空间模型和概率矩阵分解的推荐算法



曹玉琳



，李文立

（大连理工大学经济管理学院，辽宁大连１１６０２４）

摘　要：传统的矩阵分解算法在时间上将全部训练数据作为整体进行计算以获得用户兴趣特征，忽略了用户兴

趣漂移问题。针对此问题，提出一种基于状态空间模型和概率矩阵分解的推荐算法。首先将用户兴趣特征向量

与用户评分数据的矩阵分解映射到线性高斯状态空间中；然后使用

ＥＭ算法和卡尔曼滤波器对模型参数进行动

态求解；最后根据前后获得用户兴趣特征向量确认用户兴趣是否发生漂移，并进行相应推荐。实验结果表明，该

算法与传统的矩阵分解推荐算法相比，能更好地感知用户兴趣漂移，提高推荐质量。

关键词：矩阵分解；状态空间模型；ＥＭ算法；卡尔曼滤波

中图分类号：ＴＰ３０１　　　文献标志码：Ａ　　　文章编号：１００１３６９５（２０２０）１１０１２３２６３０４

ｄｏｉ：１０．１９７３４／ｊ．ｉｓｓｎ．１００１３６９５．２０１９．０８．０２７６

Ｒｅｃｏｍｍｅｎｄａｔｉｏｎａｌｇｏｒｉｔｈｍｂａｓｅｄｏｎｓｔａｔｅｓｐａｃｅｍｏｄｅｌａｎｄ

ｐｒｏｂａｂｉｌｉｓｔｉｃｍａｔｒｉｘｆａｃｔｏｒｉｚａｔｉｏｎ

ＣａｏＹｕｌｉｎ



，ＬｉＷｅｎｌｉ

（ＦａｃｕｌｔｙｏｆＭａｎａｇｅｍｅｎｔ＆Ｅｃｏｎｏｍｉｃｓ，ＤａｌｉａｎＵｎｉｖｅｒｓｉｔｙｏｆＴｅｃｈｎｏｌｏｇｙ，ＤａｌｉａｎＬｉａｏｎｉｎｇ１１６０２４，Ｃｈｉｎａ）

Ａｂｓｔｒａｃｔ：Ｔｈｅｔｒａｄｉｔｉｏｎａｌｍａｔｒｉｘｆａｃｔｏｒｉｚａｔｉｏｎａｌｇｏｒｉｔｈｍｕｓｅｓａｌｌｔｈｅｔｒａｉｎｉｎｇｄａｔａａｓａｗｈｏｌｅｔｏｏｂｔａｉｎｕｓｅｒｉｎｔｅｒｅｓｔｆｅａｔｕｒｅｓ

ｆｒｏｍｔｈｅｐｅｒｓｐｅｃｔｉｖｅｏｆｔｉｍｅ

，ｉｇｎｏｒｉｎｇｔｈｅｄｒｉｆｔｏｆｕｓｅｒｉｎｔｅｒｅｓｔ．Ｔｏａｄｄｒｅｓｓｔｈｉｓｐｒｏｂｌｅｍ，ｔｈｉｓｐａｐｅｒｐｒｏｐｏｓｅｄａｒｅｃｏｍｍｅｎｄａｔｉｏｎ

ａｌｇｏｒｉｔｈｍｂａｓｅｄｏｎｓｔａｔｅｓｐａｃｅｍｏｄｅｌａｎｄｐｒｏｂａｂｉｌｉｔｙｍａｔｒｉｘｆａｃｔｏｒｉｚａｔｉｏｎ．Ｆｉｒｓｔｌｙ，ｔｈｉｓｍｅｔｈｏｄｍａｐｐｅｄｔｈｅｍａｔｒｉｘｆａｃｔｏｒｉｚａｔｉｏｎｏｆ

ｕｓｅｒｉｎｔｅｒｅｓｔｆｅａｔｕｒｅｖｅｃｔｏｒａｎｄｕｓｅｒｒａｔｉｎｇｄａｔａｉｎｔｏｌｉｎｅａｒＧａｕｓｓｉａｎｓｔａｔｅｓｐａｃｅ．Ｔｈｅｎ

，ｉｔｕｓｅｄＥＭａｌｇｏｒｉｔｈｍａｎｄＫａｌｍａｎｆｉｌｔｅｒ

ｔｏｓｏｌｖｅｔｈｅｍｏｄｅｌｐａｒａｍｅｔｅｒｓｄｙｎａｍｉｃａｌｌｙ．Ｆｉｎａｌｌｙ，ｉｔｏｂｔａｉｎｅｄｔｈｅｕｓｅｒｉｎｔｅｒｅｓｔｆｅａｔｕｒｅｖｅｃｔｏｒｔｏｃｏｎｆｉｒｍｗｈｅｔｈｅｒｔｈｅｕｓｅｒｉｎｔｅｒｅｓｔ

ｄｒｉｆｔｓｏｒｎｏｔ，ａｎｄｍａｄｅｔｈｅｒｅｃｏｍｍｅｎｄａｔｉｏｎ．Ｔｈｅｅｘｐｅｒｉｍｅｎｔｓｄｅｍｏｎｓｔｒａｔｅｔｈａｔｔｈｅｐｒｏｐｏｓｅｄａｌｇｏｒｉｔｈｍｃａｎｂｅｔｔｅｒｐｅｒｃｅｉｖｅｕｓｅｒ

ｉｎｔｅｒｅｓｔｄｒｉｆｔａｎｄｉｍｐｒｏｖｅｔｈｅｒｅｃｏｍｍｅｎｄａｔｉｏｎｑｕａｌｉｔｙｃｏｍｐａｒｅｄｗｉｔｈｔｈｅｔｒａｄｉｔｉｏｎａｌｍａｔｒｉｘｆａｃｔｏｒｉｚａｔｉｏｎａｌｇｏｒｉｔｈｍ．

Ｋｅｙｗｏｒｄｓ：ｍａｔｒｉｘｆａｃｔｏｒｉｚａｔｉｏｎ；ｓｔａｔｅｓｐａｃｅｍｏｄｅｌ；ＥＭａｌｇｏｒｉｔｈｍ；Ｋａｌｍａｎｆｉｌｔｅｒｉｎｇ

０　引言

推荐系统作为解决信息过载问题的有效手段在诸多领域得

到了广泛应用。矩阵分解是目前实现推荐系统的主流方法，包

括奇异值分解

［１，２］

（ｓｉｎｇｕｌａｒｖａｌｕｅｄｅｃｏｍｐｏｓｉｔｉｏｎ，ＳＶＤ）、非负矩阵

分解

［３，４］

（ｎｏｎｎｅｇａｔｉｖｅｍａｔｒｉｘｆａｃｔｏｒｉｚａｔｉｏｎ，ＮＭＦ）、概率矩阵分

解

［５～７］

（ｐｒｏｂａｂｉｌｉｓｔｉｃｍａｔｒｉｘｆａｃｔｏｒｉｚａｔｉｏｎ，ＰＭＦ）等。矩阵分解是一

种基于线性分析的无监督潜因子学习方法，在给定的损失函数

下获得一个最优解并拟合出一个低阶近似矩阵。用户—项目评

分矩阵的每一项都是受高斯白噪声干扰的用户和项目潜在特征

线性组合的结果，因此用户和项目的潜在特征从每个用户对项

目的评分中推断而出，并且根据这种潜在特征估计用户对缺失

项目的评分和用户间兴趣的相似度。在发现不同的特性时，通

常假设潜在特性的数量远小于用户的数量和项目的数量

［８］

。

传统的矩阵分解方法使用历史数据学习得到的是用户和

项目在某一时刻的单点特征，而且数据的时间顺序与模型及推

荐结果无关，因此得到的模型为静态模型。但实际上用户的兴

趣是有生命周期的，用户的兴趣从产生、发展、达到高峰、消退，

会经历一个兴趣漂移的过程。从生命周期的角度，可以将用户

的兴趣分为长期兴趣、短期兴趣和周期性兴趣，因此将全部历

史数据在时间上不加区分地视为整体来获得用户的兴趣模型

会大大降低推荐准确率和推荐精度。

目前已经有学者将时间因素引入矩阵分解方法中以解决

用户兴趣漂移问题，主要包括两类方法。一类是从用户间或项

目间时序行为的角度出发，将时序信息与矩阵分解方法相融

合。文献［

９］提出一种时间感知的隐因子模型，该模型将用户

对项目的评分分解成不同的部分，并考虑时间因素对不同部分

的影响，区分出瞬变因素与持久因素，并进一步通过矩阵分解

和领域模型进行推荐以解决标签推荐精度不足的问题。文献

［

１０］提出了一种基于时序消费行为的最近邻建模方法，通过

构建基于时间序列的消费网络，获取用户或项目的相互影响关

系。该方法只考虑用户的消费时间，不需要额外的信息，通过

有向计算挖掘用户或项目间影响关系，从而识别用户或项目的

近邻集合。文献［

１１］提出了一种适用于时序数据的矩阵分解

模型，将连续时间点上产生的数据构成的矩阵分解成两个低秩

矩阵，并提出该问题的概率图模型，然后得出最优化模型进行

求解。文献［１２］针对大多数矩阵分解方法将时间数据作为单

独一维进行建模导致计算复杂度过高的问题，提出一种时序模

型与矩阵分解模型相结合的方法，通过提取推荐对象的特征并

挖掘时序数据特征的趋势来提高推荐结果的有效性。上述研

究虽然利用了数据的时序性，但是对时序信息描述精度不够，

得到的模型参数无法动态改变，因此不是真正的动态模型。针

对此问题，另一类方法则引入马尔可夫模型，将状态空间信息

与矩阵分解相结合，进一步提高推荐精度。文献［

１３］提出一

种基于时间的嵌入式隐马尔可夫模型，并将会话信息嵌入到欧

几里德空间中。该模型计算用户与歌曲、歌曲与歌曲、会话与

会话之间的相似度，通过对三种效应的时间动力学建模，将其

第３７卷第１１期

２０２０年１１月　

计算机应用研究

ＡｐｐｌｉｃａｔｉｏｎＲｅｓｅａｒｃｈｏｆＣｏｍｐｕｔｅｒｓ

Ｖｏｌ３７Ｎｏ１１

Ｎｏｖ．２０２０

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38717450

粉丝: 7
资源: 952

状态空间模型与概率矩阵分解结合的推荐算法

基于用户兴趣漂移的推荐系统

Probabilistic Matrix Factorization概率矩阵分解Python源代码

请介绍一下随机游走模型和DeepWalk模型的基本原理

盲源分离算法中的easi算法

mimo系统中的信号检测算法

最优化算法有哪些，分别介绍一下

常用的无监督学习方法有哪些

计算机专业的数学基础

matlab如何做量子

matlab无监督学习

马尔可夫决策过程动态规划用python实现

Word2Vec和GloVe对比，各自的优点和局限性是什么

机器人操作de数学导论

基于微信小程序的新生报到系统设计与实现.docx

基于java的电商平台的设计与实现.docx

基于java的大学生智能消费记账系统的设计与实现.docx

基于java的植物健康系统设计与实现.docx

weixin151云匹面粉直供微信小程序+springboot.rar

计算2296傅奕群.html

基于java的手机商城设计与开发设计与实现.docx

最新资源