掌握正则表达式：捕获组与非捕获组详解

170 浏览量更新于2024-08-28 收藏 110KB PDF 举报

正则表达式中的捕获组和非捕获组是高级模式匹配技术的一部分，它们允许我们在搜索文本时保留并标记感兴趣的特定部分，以便后续的处理或引用。在本文中，我们将深入探讨这两种类型的组以及它们的用法。 **捕获组（Capturing Group）** 捕获组由小括号 `()` 表示，用于创建一个子模式。当正则表达式执行时，它会尝试找到该模式并在匹配结果中保存这部分内容。例如： ```csharp (string) pattern ``` 如 `(abc)+d`，将匹配 "abcd" 或 "abcabcd"，这里的 "(abc)" 就是一个捕获组，被编号为1（因为它是第一个出现的）。被捕获的部分可以通过 `Match.Groups` 集合中的索引访问，如 `m.Groups[1]`。 **非捕获组（Non-Capturing Group）** 非捕获组用 `(?<name>pattern)` 或 `(?'name'pattern)` 的形式表示，虽然它们同样起到分组的作用，但不会自动为匹配的结果分配组号。这样可以避免组号冲突或无意中保留某些匹配结果。非捕获组在反向引用时与普通捕获组有所不同，如 `\k<name>`。 **反向引用（Backreference）** 反向引用是通过数字 `(\num)` 或命名引用 `\k<name>` 来实现的，用于引用先前捕获的组。`\2` 和 `\1` 是两个常见的例子，分别代表第二和第一个捕获组。如 `(\w)(\w)\2\1` 会匹配 "abba"，因为 `\2` 引用了第一个括号中的 `\w`，而 `\1` 引用了第二个括号中的 `\w`。 **应用示例：Regex.Match方法** 在编程中，我们经常使用正则表达式库，如 C# 的 `Regex.Match` 方法来处理文本。例如，解析URL： ```csharp string source = "http://reg-test-server:8080/download/file1.html#"; string regex = @"(\w+):\/\/([^/:]+)(:\d+)?([^#]*)"; Regex regUrl = new Regex(regex); Match m = regUrl.Match(source); if (m.Success) { for (int i = 1; i <= m.Groups.Count; i++) // 开始索引为1，因为索引0是整个匹配字符串 { Console.WriteLine(string.Format("{0}: {1}", i, m.Groups[i].Value)); } } ``` 这段代码展示了如何使用捕获组来解析URL的不同部分（协议、主机名、端口和路径），并将它们按组号顺序输出。正则表达式中的捕获组和非捕获组提供了强大的模式匹配功能，使得我们能够灵活地处理文本中的特定模式，并在需要时复用这些匹配信息。理解并掌握它们是编写高效正则表达式的关键，尤其是在处理大量文本数据或需要复杂逻辑的场景中。

weixin_38603204

粉丝: 3
资源: 972

掌握正则表达式：捕获组与非捕获组详解

java正则表达式之非捕获组

pb 使用正则表达式源码pbregexp

PHP正则表达式之捕获组与非捕获组

python正则表达式：-0/18/5-

正则表达式的捕获组通常写法

java使用正则表达式获取捕获组信息

PHP之正则表达式捕获组与非捕获组（详解）

正则表达式语法规则/正则表达式语法规则

js 正则表达式 验证 a/b/c 格式的类型数据

深入浅析正则表达式 捕获组

最新资源

js 正则表达式验证 a/b/c 格式的类型数据

深入浅析正则表达式捕获组