快速挖掘高平均效用项集的创新算法
99 浏览量
更新于2024-07-15
收藏 1.42MB PDF 举报
挖掘高平均效用项集(High-Average Utility Itemsets, HUIs)是近年来交易数据库领域中的热门研究课题。在传统的数据挖掘任务中,寻找频繁项集(frequent itemsets)是基础,而HUIs则扩展了这一概念,它关注的是那些尽管出现频率不高,但整体贡献度较大的项集组合。这种度量方式在很多实际场景下具有重要意义,例如市场篮子分析、客户忠诚度分析以及个性化推荐系统等。
这篇名为"A fast algorithm for mining high average-utility itemsets"的研究论文由Jerry Chun-Wei Lin、Shifeng Ren、Philippe Fournier-Viger、Tzung-Pei Hong、Ja-Hwung Su和Bay Vo等人合作撰写,发表于2017年的《应用智能》(ApplIntell)期刊,DOI为10.1007/s10489-017-0896-1。论文的核心内容探讨了一种高效的算法,旨在快速识别出那些在给定数据集中具有高平均效用的项集。
在论文中,作者首先回顾了HUIs问题的基本背景和现有方法,强调了现有方法在处理大规模数据时存在的效率挑战。他们提出了新算法的主要思想,可能是通过改进的关联规则挖掘策略,结合统计学方法,如期望价值或加权频率,来提升搜索效率。该算法可能采用了剪枝技术、并行计算或者启发式搜索策略,以减少计算复杂度和内存消耗。
算法的关键特性可能包括:
1. **高效性**:论文重点在于提出一种能有效处理大规模数据集的算法,能够在保证准确性的前提下,显著缩短发现高平均效用项集的时间。
2. **可扩展性**:针对大数据环境,设计了能够处理海量交易记录的架构,支持分布式计算,使得算法在处理实时或批量数据时都能保持性能。
3. **精度与效率平衡**:在挖掘过程中,既考虑了项集的频度,又充分考虑了它们对整体效用的贡献,实现了精确性和效率之间的良好平衡。
4. **实证分析**:论文可能会包含详细的实验评估,展示新算法在不同规模和类型的数据库上的性能对比,以及与现有方法的比较结果。
这篇文章是数据库挖掘领域的一份重要贡献,为解决高平均效用项集的挖掘问题提供了新的解决方案。对于数据科学家、数据库管理员和商业智能专家来说,理解和应用这项研究成果,可以帮助他们在实际业务场景中提高数据分析的精准性和效率。
2021-03-13 上传
2021-04-05 上传
点击了解资源详情
点击了解资源详情
2021-03-13 上传
2022-11-28 上传
点击了解资源详情
106 浏览量
点击了解资源详情

weixin_38581777
- 粉丝: 4
最新资源
- 易二维码签到系统:会议活动签到解决方案
- Ceres库与SDK集成指南:C++环境配置及测试程序
- 深入理解Servlet与JSP技术应用与源码分析
- 初学者指南:掌握VC摄像头抓图源代码实现
- Java实现头像剪裁与上传的camera.swf组件
- FileTime 2013汉化版:单文件修改文件时间的利器
- 波斯语话语项目:实现discourse-persian配置指南
- MP4视频文件数据恢复工具介绍
- 微信与支付宝支付功能封装工具类介绍
- 深入浅出HOOK编程技术与应用
- Jettison 1.0.1源码与Jar包免费下载
- JavaCSV.jar: 解析CSV文档的Java必备工具
- Django音乐网站项目开发指南
- 功能全面的FTP客户端软件FlashFXP_3.6.0.1240_SC发布
- 利用卷积神经网络在Torch 7中实现声学事件检测研究
- 精选网站设计公司官网模板推荐