快速挖掘高平均效用项集的创新算法
139 浏览量
更新于2024-07-15
收藏 1.42MB PDF 举报
挖掘高平均效用项集(High-Average Utility Itemsets, HUIs)是近年来交易数据库领域中的热门研究课题。在传统的数据挖掘任务中,寻找频繁项集(frequent itemsets)是基础,而HUIs则扩展了这一概念,它关注的是那些尽管出现频率不高,但整体贡献度较大的项集组合。这种度量方式在很多实际场景下具有重要意义,例如市场篮子分析、客户忠诚度分析以及个性化推荐系统等。
这篇名为"A fast algorithm for mining high average-utility itemsets"的研究论文由Jerry Chun-Wei Lin、Shifeng Ren、Philippe Fournier-Viger、Tzung-Pei Hong、Ja-Hwung Su和Bay Vo等人合作撰写,发表于2017年的《应用智能》(ApplIntell)期刊,DOI为10.1007/s10489-017-0896-1。论文的核心内容探讨了一种高效的算法,旨在快速识别出那些在给定数据集中具有高平均效用的项集。
在论文中,作者首先回顾了HUIs问题的基本背景和现有方法,强调了现有方法在处理大规模数据时存在的效率挑战。他们提出了新算法的主要思想,可能是通过改进的关联规则挖掘策略,结合统计学方法,如期望价值或加权频率,来提升搜索效率。该算法可能采用了剪枝技术、并行计算或者启发式搜索策略,以减少计算复杂度和内存消耗。
算法的关键特性可能包括:
1. **高效性**:论文重点在于提出一种能有效处理大规模数据集的算法,能够在保证准确性的前提下,显著缩短发现高平均效用项集的时间。
2. **可扩展性**:针对大数据环境,设计了能够处理海量交易记录的架构,支持分布式计算,使得算法在处理实时或批量数据时都能保持性能。
3. **精度与效率平衡**:在挖掘过程中,既考虑了项集的频度,又充分考虑了它们对整体效用的贡献,实现了精确性和效率之间的良好平衡。
4. **实证分析**:论文可能会包含详细的实验评估,展示新算法在不同规模和类型的数据库上的性能对比,以及与现有方法的比较结果。
这篇文章是数据库挖掘领域的一份重要贡献,为解决高平均效用项集的挖掘问题提供了新的解决方案。对于数据科学家、数据库管理员和商业智能专家来说,理解和应用这项研究成果,可以帮助他们在实际业务场景中提高数据分析的精准性和效率。
点击了解资源详情
点击了解资源详情
点击了解资源详情
2021-03-13 上传
2021-04-05 上传
2021-03-13 上传
2022-11-28 上传
2021-07-14 上传
2021-07-14 上传
weixin_38581777
- 粉丝: 4
- 资源: 917
最新资源
- python数据结构和算法
- Projeto-PaginaDeCaptura:创建捕获页面项目的目的是注册活动人员。 使用在线工具Mailchimp访问参与者的注册
- css_sideproject
- billiards-server:台球厅管理系统微观代码
- react-suspenser::sloth:简化延迟加载过程的管理
- ltfat.github.io:LTFAT网页
- IntroToAlgorithms:CS3-使用Jupyter Notebooks的C ++算法简介
- devfest-Lima2015-javafx:DevFest Lima 2015-JavaFX有什么不错的选择吗? 动画和粒子工作室
- 42559298three-phase-SVPWM-Inverter.rar_matlab例程_matlab_
- Tutorium_Summer_2021_Prog2:教职员工
- product_ping:Ping产品以检查库存状态
- STM32 Debug+Mass storage+VCP V2.J40.M27固件+原理图
- 毕业设计&课设-AMrotor-一个用于旋转机械仿真的MATLAB工具箱.zip
- CASS地物代码快速查找
- 学习语言:学习新的和不同的语言
- 5kCMS K1 网站内容管理系统 v0.1