KMP算法详解与next数组计算实例

需积分: 0 104 浏览量更新于2024-08-04 收藏 122KB DOCX 举报

KMP算法总结 KMP算法（Knuth-Morris-Pratt Algorithm）是一种高效的字符串匹配算法，用于在一个文本串（主串，也称为haystack）中查找一个模式串（pattern）。它的主要目标是提高字符串搜索的效率，特别是在模式串在主串中出现多次或者频繁发生位置偏移时。KMP算法的核心在于预处理模式串，通过构建一个next数组来存储模式串中每个位置的最长前后缀相等的前缀长度，从而避免了在每次比较失败后回溯整个模式串。 1. **计算next数组**: - next数组是一个整数数组，其长度与模式串相同。数组中的每个元素next[i]表示模式串中字符索引i之前的最长前缀与前缀i相同的字符的位置。初始化next[0]为-1，表示前缀长度为0的特殊情况，实际计算是从next[1]开始。 - 计算过程采用两个指针i和j，i逐次增加，j跟踪上一次匹配失败的位置。当str[j+1]不等于str[i]且j已经到达-1（即没有找到相同前缀），j会回退到next[j]的位置继续寻找。如果str[i]和str[j+1]相等，说明找到了一个更长的相同前缀，更新next[i]为j+1；否则，说明当前位置没有相同的前缀，next[i]置为-1。 2. **KMP搜索过程**: - 在主函数中，输入主串str和模式串ptr，首先获取它们的长度slen和plen。调用cal_next函数计算next数组。 - KMP算法的主要搜索过程使用两个指针s_i和p_i，分别遍历主串和模式串。当str[s_i]等于ptr[p_i]时，同时移动两个指针。如果str[s_i]不等于ptr[p_i]，检查p_i是否为0，如果是，则只需移动s_i；如果不是，根据next[p_i-1]的值找到跳过的字符数，将p_i更新为其对应的next值加1。 - 当p_i达到plen时，说明找到匹配，返回s_i-plen作为匹配位置；若搜索结束但未找到匹配，返回-1。 3. **next数组的预处理**: - compute_next函数接收一个常量引用的模式串，通过字符串库函数strlen获取长度，然后直接遍历模式串，利用已知的next数组计算规则填充数组。这个过程可以提前完成，为后续的KMP搜索提供优化。 KMP算法的关键优势在于它利用next数组减少了回溯次数，当匹配失败时，只需根据next数组中的值移动模式串指针，而无需回退到前一个字符，大大提高了查找效率。这对于处理大量数据或频繁搜索的情况尤其有用。

cal_next( ptr, next, plen );

printf( "%d\n", KMP( str, slen, ptr, plen, next ) );

}

return 0;

}//主函数

2.下面给出一段计算 next[]的代码：

这样求出来的 next 数组其实是从下标 1 开始的，因为下标 0 之前是个空串，下标 1 则

对应着 M 串的第 0 个字符。我们设 next[0]=-1，仅仅是个标志而已，没有什么特殊的含义。

#include<string.h>

#include <iostream>

using namespace std;

void compute_next(const string& pattern)

{

const int pattern_length = pattern.size();

int *next_function = new int[pattern_length];

int index;

next_function[0] = -1;

for(int i=1;i<pattern_length;++i)

{

index = next_function[i-1];

//store previous fail position k to index;

while(index>=0 && pattern[i]!=pattern[index+1])

{

index = next_function[index];

}

if(pattern[i]==pattern[index+1])

{

next_function[i] = index + 1;

}

剩余11页未读，继续阅读

王向庄

粉丝: 25
资源: 344

KMP算法详解与next数组计算实例

KMP算法学习&总结

数据结果 kmp算法实验报告

samcat2021#ZXBlog#Hdu - 1711. Number Sequence以及KMP算法总结1

算法总结kmp、树状数组等

kmp详解 kmp详解

KMP模式匹配1

KMP(字符串匹配)算法总结

KMP.rar_KMP

KMP源码

Kmp算法

最新资源