ESSK：点击流相似度计算的新方法

需积分: 11 54 浏览量更新于2024-09-12 收藏 314KB PDF 举报

"ESSK_一种计算点击流相似度的新方法是针对点击流数据处理的算法，旨在提高用户会话分析的准确性和区分度。该方法由刘嘉祁奇、陈振宇、惠成峰等人在2012年的《计算机科学》杂志上提出，用于解决SSK（String Subsequence Kernel）算法在计算点击流相似度时存在的问题。ESSK（Extended String Subsequence Kernel）通过考虑所有长度的子序列来构建特征空间，以增强模型的表达能力。与仅选择固定长度k的子序列相比，这种方法能获取更全面的相似度信息。此外，他们还提出了一种高效的算法来降低ESSK的计算复杂度，使得在大规模数据集上的应用成为可能。点击流相似度在Web使用挖掘中扮演着重要角色，它可以帮助识别用户的兴趣模式，用于用户会话的分类和聚类。SSK原本是用于计算字符串相似度的算法，后来被应用于点击流数据，但其固定长度k的限制可能导致特征不足，影响相似度的准确性。ESSK则通过扩展子序列长度，解决了这一问题，能够提供更为精确的相似度评估。实验结果证实，ESSK相比于SSK在点击流相似度计算上表现更优，具有更高的区分度，这使得ESSK在实际应用中，如用户行为分析、个性化推荐系统和网络流量监控等方面具有更大的潜力。文章的关键词包括点击流相似度、算法设计和计算复杂度，表明了研究的核心内容和关注点。根据中图法分类号TP301，可以推断这是属于计算机科学与技术领域的研究成果，具有较高的学术价值和实践意义。"

huyao_huyao

粉丝: 0
资源: 14

ESSK：点击流相似度计算的新方法

IKAnalyzer中文分词计算句子相似度

相似度查询

中文文本相似度匹配算法 simHash 海明距离 IK分词

计算batch_size个向量的余弦相似度

python中文相似度_python实现简单的文本相似度分析操作详解

python词组语义相似度_【NLP】BERT语义相似度计算

用python计算调整余弦相似度

计算矩阵相似度的方法

计算tfidf向量相似度

最新资源