利用张量分解和用户聚类提升标签推荐精度

需积分: 9 1 下载量 69 浏览量 更新于2024-08-13 收藏 1.26MB PDF 举报
"基于多元关系的张量分解标签推荐方法" 本文主要探讨了一种新的标签推荐方法,旨在解决大数据环境下的推荐系统准确率问题。现有的标签推荐算法往往忽略了多属性特征之间的联系,导致推荐质量受到影响。针对这一挑战,研究者提出了一种结合用户聚类和张量分解的策略,以提升标签推荐的精确度。 首先,该方法通过聚类分析对那些对产品具有显著影响的用户进行分组。聚类是数据分析中的一个重要步骤,它能帮助识别具有相似行为或偏好特征的用户群体,从而更准确地理解用户的兴趣模式。通过聚类,可以更好地捕捉用户间的共性,为后续的推荐过程提供更有针对性的信息。 接下来,研究中利用用户、产品、标签和产品评分之间的多元关系来计算总权重。这些多元关系反映了用户在使用产品时的各种互动和评价,包括用户对特定标签的偏好、用户对产品的评价以及产品与标签的关联性等。通过综合这些因素,可以构建一个更全面的用户-产品-标签模型,以反映复杂的数据结构。 然后,基于聚类后的用户群体和上述计算的总权重,构建了一个张量(多维数组)。张量分解是一种有效的数据处理技术,特别是在处理高维数据时,它可以揭示隐藏的潜在模式和关系。在本研究中,采用张量分解对构建的张量进行分析,这有助于提取用户群体和标签之间的深层次关联。 最后,通过张量分解的结果,为每个用户生成个性化的标签推荐列表。这种方法的优势在于,它不仅考虑了用户的行为,还考虑了不同属性之间的相互作用,使得推荐更加精准。 实验结果表明,与传统的张量分解方法相比,这种新方法在推荐准确率上有明显提升,验证了该算法的有效性和实用性。这项研究对于大数据环境下的推荐系统优化具有重要的理论价值和实际应用前景,特别是在软件工程和数据挖掘领域,可以为相关领域的研究提供新的思路和方法。 关键词:标签推荐,张量因子分解,权重,聚类 中图分类号:TP181 文献标志码:A 文章编号:1001-3695(2019)10-005-2907-04 doi:10.19734/j.issn.1001-3695.2018.04.0215 作者简介:曾辉,胡强,淦修修,均来自华东交通大学信息工程学院,研究方向涉及软件工程和数据挖掘。