使用后缀托盘、数组和树的模式匹配(2014)

0 下载量 182 浏览量 更新于2024-07-14 收藏 585KB PDF 举报
"Pattern Matching using Suffix Trays, Arrays and Trees (2014)" 论文探讨了一种新的数据结构——后缀托盘(Suffix Tray),作为精确模式匹配的替代方案。作者Jens Olaf Svanholm Fogh在2014年完成此硕士论文,由Christian Storm Pedersen指导,发表于奥胡斯大学计算机科学系。 精确模式匹配是科学研究中广泛应用的一种技术。传统的数据结构如后缀树(Suffix Tree)和后缀数组(Suffix Array)是进行精确模式匹配的主流选择。然而,这篇论文提出了后缀托盘这一新概念,它旨在提供一个在预处理时间和空间限制为O(n·|Σ|)和O(n)的情况下,具有更优查询时间复杂度的数据结构。 后缀托盘的查询时间复杂度在最坏情况下为O(m + log(|Σ|)),其中m代表查询字符串的长度,|Σ|表示字母表的大小。这优于后缀树和后缀数组的最坏情况复杂度。后缀树在相同预处理和空间限制下,查询时间复杂度为O(m·log(|Σ|)),而后缀数组则为O(m + log(n))。 后缀托盘通过结合后缀树和后缀数组的思想实现了这一改进。它在保持高效查询性能的同时,减少了对内存的需求,特别是在处理大规模文本数据时,这种优化显得尤为重要。论文可能详细讨论了如何构建后缀托盘,以及如何利用其特性来快速响应模式匹配查询。 此外,论文还可能对比分析了后缀托盘与其他两种数据结构在不同场景下的性能,包括各种查询类型、文本特性和实际应用中的效率。它可能还包括了实现细节、算法优化以及可能的扩展和未来研究方向。这篇论文为模式匹配领域引入了一种新的有效工具,对提高大规模文本处理的效率有着积极的贡献。