模糊时间间隔序列模式挖掘算法TiCMiner:提升数据挖掘精度

需积分: 6 0 下载量 149 浏览量 更新于2024-09-06 收藏 240KB PDF 举报
该论文研究关注的是"一种改进的模糊时间间隔序列模式算法",由葛慧晗和郭燕慧两位学者共同完成,他们来自北京邮电大学网络空间安全学院。论文背景强调了序列模式挖掘在数据挖掘中的重要性,特别是对于理解事务频繁出现的模式,这对于诸如银行流水数据分析和Web日志分析等领域具有实际应用价值。然而,现有的时间间隔序列模式挖掘方法在处理时间间隔较大时,挖掘精度往往受限,且依赖于人为设定的临界值,这限制了其在实际场景中的效率和准确性。 为此,论文提出了一种名为TiCMiner的模糊时间间隔序列模式挖掘算法。其核心思想在于通过模糊聚类技术对时间间隔进行细分,这样能够更好地适应不同长度的时间间隔,从而提高挖掘精度。然而,考虑到处理时间间隔带来的计算复杂性可能会影响算法的运行效率,作者针对性地优化了连接与剪枝策略,旨在在保持算法效率的同时提升性能。 为了验证算法的有效性,研究者将TiCMiner应用到真实银行流水数据集以及经典的序列模式挖掘数据集上进行测试。结果显示,相比于现有方法,新算法在不显著增加运行时间的前提下,显著提高了序列模式挖掘的精度。论文的关键领域包括计算机技术、序列模式挖掘、模糊C聚类以及时间间隔处理,这些技术的结合为解决实际问题提供了创新的解决方案。 这篇论文不仅提升了时间间隔序列模式挖掘的理论技术水平,也为实际数据分析提供了实用工具,对于提升数据挖掘的准确性和效率具有重要的学术价值。在未来的工作中,这种改进方法有可能推动序列模式挖掘技术在更多领域的应用和发展。