ESSK:点击流相似度计算的新方法
需积分: 11 54 浏览量
更新于2024-09-12
收藏 314KB PDF 举报
"ESSK_一种计算点击流相似度的新方法是针对点击流数据处理的算法,旨在提高用户会话分析的准确性和区分度。该方法由刘嘉祁奇、陈振宇、惠成峰等人在2012年的《计算机科学》杂志上提出,用于解决SSK(String Subsequence Kernel)算法在计算点击流相似度时存在的问题。ESSK(Extended String Subsequence Kernel)通过考虑所有长度的子序列来构建特征空间,以增强模型的表达能力。与仅选择固定长度k的子序列相比,这种方法能获取更全面的相似度信息。此外,他们还提出了一种高效的算法来降低ESSK的计算复杂度,使得在大规模数据集上的应用成为可能。
点击流相似度在Web使用挖掘中扮演着重要角色,它可以帮助识别用户的兴趣模式,用于用户会话的分类和聚类。SSK原本是用于计算字符串相似度的算法,后来被应用于点击流数据,但其固定长度k的限制可能导致特征不足,影响相似度的准确性。ESSK则通过扩展子序列长度,解决了这一问题,能够提供更为精确的相似度评估。
实验结果证实,ESSK相比于SSK在点击流相似度计算上表现更优,具有更高的区分度,这使得ESSK在实际应用中,如用户行为分析、个性化推荐系统和网络流量监控等方面具有更大的潜力。文章的关键词包括点击流相似度、算法设计和计算复杂度,表明了研究的核心内容和关注点。根据中图法分类号TP301,可以推断这是属于计算机科学与技术领域的研究成果,具有较高的学术价值和实践意义。"
2017-11-17 上传
2023-08-11 上传
2023-10-07 上传
2023-05-19 上传
2023-05-19 上传
2023-07-28 上传
2023-05-23 上传
huyao_huyao
- 粉丝: 0
- 资源: 14
最新资源
- Fisher Iris Setosa数据的主成分分析及可视化- Matlab实现
- 深入理解JavaScript类与面向对象编程
- Argspect-0.0.1版本Python包发布与使用说明
- OpenNetAdmin v09.07.15 PHP项目源码下载
- 掌握Node.js: 构建高性能Web服务器与应用程序
- Matlab矢量绘图工具:polarG函数使用详解
- 实现Vue.js中PDF文件的签名显示功能
- 开源项目PSPSolver:资源约束调度问题求解器库
- 探索vwru系统:大众的虚拟现实招聘平台
- 深入理解cJSON:案例与源文件解析
- 多边形扩展算法在MATLAB中的应用与实现
- 用React类组件创建迷你待办事项列表指南
- Python库setuptools-58.5.3助力高效开发
- fmfiles工具:在MATLAB中查找丢失文件并列出错误
- 老枪二级域名系统PHP源码简易版发布
- 探索DOSGUI开源库:C/C++图形界面开发新篇章