信息学奥赛一本通1169：如何高效实现字符串匹配？

在信息学奥赛一本通第1169题中，要求实现高效的字符串匹配。一个常见问题是：当使用朴素字符串匹配算法时，时间复杂度过高，在主串与模式串长度较大时容易超时。如何优化？能否结合KMP算法减少不必要的字符比较？关键在于理解next数组的构建原理：它记录模式串中每个位置前最长相等前后缀的长度，从而在失配时快速跳转，避免回溯主串指针。如何正确构造next数组并应用于匹配过程，是解决本题的核心难点。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
揭假求真 2025-11-06 14:22
关注
1. 朴素字符串匹配的性能瓶颈分析

在信息学奥赛一本通第1169题中，常见的字符串匹配任务是判断模式串 P 是否在主串 S 中出现。若采用朴素（Brute Force）算法，其基本思想是从主串的每一个位置开始尝试与模式串逐字符比对。

该算法的时间复杂度为 O(n×m)，其中 n 是主串长度，m 是模式串长度。当两者均达到 1e5 级别时，最坏情况下的操作次数可达 1e10，明显超出时间限制。

例如，主串为 "aaaaab"，模式串为 "aaab"，每次匹配失败后主串指针需回退，导致大量重复比较。

2. KMP算法的核心思想与优势

KMP（Knuth-Morris-Pratt）算法通过预处理模式串构造 next 数组，实现主串指针不回溯，从而将时间复杂度优化至 O(n + m)。

其核心在于：当模式串在某位置失配时，利用已知的“最长相等前后缀”信息，跳过不可能成功的匹配位置。

例如，模式串 "ababa" 在第5位失配时，由于前缀 "aba" 与后缀 "aba" 相等，可直接将模式串右移两位继续匹配，避免从头开始。

3. next数组的定义与构建原理

next[i] 表示模式串前 i 个字符构成的子串中，最长相等真前后缀的长度。

构建过程使用双指针法：i 遍历模式串，j 记录当前最长前后缀长度。

i 模式串P[0:i] 最长相等前后缀 next[i]
0 a - 0
1 ab - 0
2 aba a 1
3 abab ab 2
4 ababa aba 3
5 ababac - 0

4. next数组的代码实现

void buildNext(const string& pattern, vector<int>& next) { int m = pattern.length(); next[0] = 0; int j = 0; for (int i = 1; i < m; ++i) { while (j > 0 && pattern[i] != pattern[j]) { j = next[j - 1]; } if (pattern[i] == pattern[j]) { j++; } next[i] = j; } }

5. KMP匹配过程的流程图
graph TD A[开始匹配] --> B{S[i] == P[j]?} B -- 是 --> C[j++, i++] C --> D{j == m?} D -- 是 --> E[找到匹配位置 i-m] D -- 否 --> B B -- 否 --> F{j == 0?} F -- 是 --> G[i++] F -- 否 --> H[j = next[j-1]] H --> B G --> B
6. 完整KMP算法实现示例

输入：主串 S，模式串 P
输出：所有匹配起始位置
步骤：
调用 buildNext 构建 next 数组
使用双指针遍历主串和模式串
失配时根据 next 数组调整 j
成功匹配时记录位置并继续

vector<int> kmpSearch(const string& text, const string& pattern) { vector<int> next(pattern.size()); buildNext(pattern, next); vector<int> result; int n = text.length(), m = pattern.length(); int i = 0, j = 0; while (i < n) { if (text[i] == pattern[j]) { i++; j++; } if (j == m) { result.push_back(i - j); j = next[j - 1]; } else if (i < n && text[i] != pattern[j]) { if (j != 0) j = next[j - 1]; else i++; } } return result; }

7. 边界条件与常见陷阱

在实际编码中，以下几点容易出错：

next[0] 必须初始化为 0
while循环中 j > 0 的判断不可省略，否则数组越界
匹配成功后应使用 j = next[j-1] 继续查找所有匹配项
主串指针 i 仅在完全无法匹配且 j=0 时才自增

8. 性能对比与应用场景扩展

算法时间复杂度空间复杂度适用场景
朴素匹配 O(n×m) O(1) 小规模数据
KMP O(n+m) O(m) 大文本搜索
BM 平均O(n/m) O(m) 编辑器查找
Rabin-Karp O(n+m) O(1) 多模式匹配

KMP特别适用于模式串固定、主串动态增长的场景，如DNA序列比对、日志关键词监控等。
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

i	模式串P[0:i]	最长相等前后缀	next[i]
0	a	-	0
1	ab	-	0
2	aba	a	1
3	abab	ab	2
4	ababa	aba	3
5	ababac	-	0

算法	时间复杂度	空间复杂度	适用场景
朴素匹配	O(n×m)	O(1)	小规模数据
KMP	O(n+m)	O(m)	大文本搜索
BM	平均O(n/m)	O(m)	编辑器查找
Rabin-Karp	O(n+m)	O(1)	多模式匹配

报告相同问题？

关注问题

1187：计算字符长度（信息学奥赛一本通）.cpp
2025-12-23 12:17

此程序以信息学奥赛为背景，详细阐述了如何用C++语言编写一个能够计算字符串长度的程序。此程序是信息学奥赛训练中的基础练习题之一，主要考察参赛者对C++标准库函数的理解和应用能力。程序中，首先需要包含必要的...
信息学奥赛一本通 提高篇全书例题习题测试数据.rar
2021-12-13 11:23

《信息学奥赛一本通 提高篇》是针对信息学竞赛深入学习的重要参考资料，涵盖了信息学奥赛NOIP（全国青少年信息学奥林匹克联赛）的重要知识点。这个压缩包包含的文件分别对应了六个关键领域的深入学习内容：图论、...
信息学奥赛一本通 1400：统计单词数（字符串匹配）
2022-06-24 23:14

GHOSTANDBREAD的博客 信息学奥赛一本通（C++版）在线评测系统 (ssoier.cn)一般的文本编辑器都有查找单词的功能，该功能可以快速定位特定单词在文章中的位置，有的还能统计出特定单词在文章中出现的次数。现在，请你编程实现这一功能，...
信息学奥赛一本通 数据结构 1355：字符串匹配问题(strs) 第一章栈
2024-03-14 17:12

长春高老师编程（信奥工作室）的博客第一行为一个整数n，表示以下有多少个由括好组成的字符串。接下来的n行，每行都是一个由括号组成的长度不超过255的字符串。,判断输入的字符串中括号是否...1355：字符串匹配问题(strs)在输出文件中有n行，每行都是。
信息学奥赛一本通 1353：表达式括号匹配(stack) | 洛谷 P1739 表达式括号匹配
2022-06-25 19:55

君义_noip的博客 ybt 1353：表达式括号匹配(stack)遍历整个字符串，遇到左括号时入栈，遇到右括号时，应该出栈一个左括号。如果遇到右括号时栈空，说明存在右括号无法配对。在遍历结束后，如果栈不为空，说明存在左括号无法配对。...
信息学奥赛一本通 1203：扩号匹配问题递归算法
2023-12-18 12:07

长春高老师编程（信奥工作室）的博客写一个程序，找到无法匹配的左括号和右括号，输出原来字符串，并在下一行标出不能匹配的括号。不能匹配的左括号用"$"标注,不能匹配的右括号用"?对每组输出数据，输出两行，第一行包含原始输入字符，第二行由"$","?...
信息学奥赛一本通(C++第五版)配套课件ppt(第五版).rar
2019-06-22 22:43

《信息学奥赛一本通(C++第五版)》是一本专为信息学竞赛设计的教程，作者黄永建以其丰富的教学经验，深入浅出地介绍了C++编程语言及其在信息学竞赛中的应用。这本书配套的PPT课件是学习过程中极其重要的辅助资料，它...
信息学奥赛一本通（C++版）第二部分基础算法例题及课后题解
2023-12-02 19:28

长春高老师编程（信奥工作室）的博客 1310 【例2.2】车厢重组。1311 【例2.5】求逆序对。1186 出现次数超过一半的数。1176 谁考了第k名。...1187 统计字符数。1178 成绩排序。1182 合影效果。1183 病人排队。1185 单词排序。1179 奖学金。
信息学奥赛一本通，题解列表
2022-09-24 18:18

少儿编程张老师的博客 信息学奥赛一本通
算法-括弧匹配检验（信息学奥赛一本通-T1354）（包含源程序）.rar
2021-09-16 22:49

在信息学奥赛中，这种问题常常被用来考察选手的逻辑思维和编程能力。括号匹配检验的目标是判断一个由不同类型的括号（如圆括号"()"、方括号"[]"和大括号"{}"）组成的字符串是否合法，即是否存在有效的一对一匹配关系...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 11月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月6日

信息学奥赛一本通1169：如何高效实现字符串匹配？

1条回答 默认 最新

1. 朴素字符串匹配的性能瓶颈分析

2. KMP算法的核心思想与优势

3. next数组的定义与构建原理

4. next数组的代码实现

5. KMP匹配过程的流程图

6. 完整KMP算法实现示例

7. 边界条件与常见陷阱

8. 性能对比与应用场景扩展

问题事件

1条回答默认最新