模糊时间间隔序列模式挖掘算法TiCMiner:提升数据挖掘精度
需积分: 6 149 浏览量
更新于2024-09-06
收藏 240KB PDF 举报
该论文研究关注的是"一种改进的模糊时间间隔序列模式算法",由葛慧晗和郭燕慧两位学者共同完成,他们来自北京邮电大学网络空间安全学院。论文背景强调了序列模式挖掘在数据挖掘中的重要性,特别是对于理解事务频繁出现的模式,这对于诸如银行流水数据分析和Web日志分析等领域具有实际应用价值。然而,现有的时间间隔序列模式挖掘方法在处理时间间隔较大时,挖掘精度往往受限,且依赖于人为设定的临界值,这限制了其在实际场景中的效率和准确性。
为此,论文提出了一种名为TiCMiner的模糊时间间隔序列模式挖掘算法。其核心思想在于通过模糊聚类技术对时间间隔进行细分,这样能够更好地适应不同长度的时间间隔,从而提高挖掘精度。然而,考虑到处理时间间隔带来的计算复杂性可能会影响算法的运行效率,作者针对性地优化了连接与剪枝策略,旨在在保持算法效率的同时提升性能。
为了验证算法的有效性,研究者将TiCMiner应用到真实银行流水数据集以及经典的序列模式挖掘数据集上进行测试。结果显示,相比于现有方法,新算法在不显著增加运行时间的前提下,显著提高了序列模式挖掘的精度。论文的关键领域包括计算机技术、序列模式挖掘、模糊C聚类以及时间间隔处理,这些技术的结合为解决实际问题提供了创新的解决方案。
这篇论文不仅提升了时间间隔序列模式挖掘的理论技术水平,也为实际数据分析提供了实用工具,对于提升数据挖掘的准确性和效率具有重要的学术价值。在未来的工作中,这种改进方法有可能推动序列模式挖掘技术在更多领域的应用和发展。
149 浏览量
123 浏览量
112 浏览量
536 浏览量
2024-11-11 上传
108 浏览量
2023-06-09 上传
158 浏览量
129 浏览量
weixin_39840914
- 粉丝: 436
- 资源: 1万+
最新资源
- Star UML指导手册
- FAT32文件系统白皮书(中文)
- 领域驱动模型详细介绍
- Asp.net开发必备51种代码(非常实用)
- 智能手机操作系统简介
- 当前,CORBA、DCOM、RMI等RPC中间件技术已广泛应用于各个领域。但是面对规模和复杂度都越来越高的分布式系统,这些技术也显示出其局限性:(1)同步通信:客户发出调用后,必须等待服务对象完成处理并返回结果后才能继续执行;(2)客户和服务对象的生命周期紧密耦合:客户进程和服务对象进程都必须正常运行;如果由于服务对象崩溃或者网络故障导致客户的请求不可达,客户会接收到异常;(3)点对点通信:客户的一次调用只发送给某个单独的目标对象。
- JSP 《标签啊,标签!》
- UDDI 注册中心介绍
- Thinking in C++, Volume 2, 2nd Edition 英文版 (pdf)
- 完全精通局域网.rar
- mtk的make命令分析
- Essential-MATLAB-for-Engineers-and-Scientists-Third-Edition
- Maven 权威指南 简体中文版
- 深入理解计算体系结构英文版
- AT&T汇编学习资料
- 计算机故障查询手册(非高手用)