子串简写蓝桥杯前缀和
时间: 2024-08-27 07:01:44 浏览: 85
在“蓝桥杯”等算法竞赛中,子串简写通常是指利用前缀和数组(Prefix Sum Array)的技术来高效地处理字符串相关的问题,特别是涉及到求解某个字符在一个子串中出现次数的情况。前缀和是一个数组,其中每个元素表示以该位置为结尾的连续子串的字符和。
例如,对于字符串 "abacabad",如果我们想知道 'a' 出现了多少次,我们可以创建一个前缀和数组,初始化为0,然后遍历字符串,每次遇到字符 'a' 就将计数加一。同时更新前缀和,如果当前字符不是 'a',则前缀和不变。最后,前缀和数组中的值减去初始值,就得到了 'a' 在原字符串每个长度范围内的出现次数。
子串简写技术通过一次预处理,使得后续查询变得非常快速,时间复杂度可以降低到 O(1) 或 O(log n),大大提高了效率。这是一种常见的数据结构优化技巧,在动态规划、字符串搜索等问题中常用。
相关问题
给出两个字符串text和pattern,其中pattern为text的子串,求出pattern在text中所有出现的位置。 为了减少骗分的情况,接下来还要输出子串的前缀数组next。
可以使用KMP算法来解决这个问题。KMP算法是一种字符串匹配算法,可以在O(n+m)的时间复杂度内找到pattern在text中所有出现的位置。
KMP算法的核心是利用pattern本身的信息来避免在text中不必要的匹配。具体来说,KMP算法维护一个next数组,其中next[i]表示pattern的前缀子串pattern[0:i]的最长公共前后缀的长度。在匹配过程中,如果text中的某个位置与pattern不匹配,那么可以利用next数组来跳过一些不必要的匹配,从而提高匹配效率。
下面是KMP算法的Python代码实现:
def kmp(text, pattern):
n = len(text)
m = len(pattern)
next = get_next(pattern)
i = 0
j = 0
res = []
while i < n:
if text[i] == pattern[j]:
i += 1
j += 1
if j == m:
res.append(i - j)
j = next[j - 1]
elif j > 0:
j = next[j - 1]
else:
i += 1
return res, next
def get_next(pattern):
m = len(pattern)
next = [0] * m
i = 1
j = 0
while i < m:
if pattern[i] == pattern[j]:
j += 1
next[i] = j
i += 1
elif j > 0:
j = next[j - 1]
else:
next[i] = 0
i += 1
return next
其中,kmp函数返回pattern在text中所有出现的位置,以及pattern的前缀数组next。get_next函数用来计算next数组。
一个子串由7个A和7个B组成,且满足所有的前缀子串中A的个数大于等于B的个数,问这样的子串有多少个
我们可以先考虑只包含7个A和7个B的子串,因为任意更长的子串都包含一个这样的子串。
对于包含7个A和7个B的子串,它们的第一个字符必然是A。因此,我们只需要考虑在后面的12个字符中插入6个B,使得插入的位置满足前缀子串中A的个数大于等于B的个数。
我们可以使用动态规划来解决这个问题。设 $dp_{i,j,k}$ 表示前 $i$ 个位置中已经插入了 $j$ 个B,前缀子串中A的个数减去B的个数为 $k$ 的方案数。则有:
$$
dp_{i,j,k} = \begin{cases}
1 & i = 14, j = 6, k \geq 0 \\
0 & i = 14, (j \neq 6 \text{ or } k < 0) \\
dp_{i-1,j-1,k-1} + dp_{i-1,j,k} & i < 14, j \leq 6, k \geq 0 \\
dp_{i-1,j,k} & i < 14, j \leq 6, k < 0 \\
0 & i < 14, j > 6
\end{cases}
$$
最终答案即为所有符合条件的子串的个数,即包含7个A和7个B的子串的个数乘以14的组合数,即:
$$
\binom{14}{7} \sum_{k=0}^{6} dp_{13,6,k}
$$
具体实现可以参考下面的Python代码:
阅读全文