正则表达式全集：匹配与重复规则详解

123 浏览量更新于2024-08-03 收藏 19KB DOCX 举报

正则表达式是一种强大的文本处理工具，用于在文本中搜索、替换和提取特定模式。本文档提供了一个全面的正则表达式全集，帮助读者理解和掌握这项技术。以下是一些关键知识点： 1. **转义字符**: - `\` 是转义字符，它使下一个字符具有特殊的含义，如`\n` 表示换行符，`\(` 表示匹配左括号。 2. **边界匹配**: - `^` 表示字符串的开始，如果在`RegExp`对象中启用`Multiline`属性，还会匹配行首。 - `$` 表示字符串的结束，同样，`Multiline`属性会使其匹配行尾。 3. **重复匹配**: - `*` 匹配前面的子表达式零次或多次。 - `+` 匹配一次或多次。 - `?` 匹配零次或一次。 - `{n}`、`{n,}` 和 `{n,m}` 分别表示精确、至少n次和最多m次的重复，例如 `o{2}` 只匹配两个连续的 "o"，`o{2,3}` 最多匹配三个。 4. **贪婪与非贪婪匹配**: - 当紧跟在限制符如 `*`、`+`、`?` 或量词后面时，`?` 实现非贪婪匹配，尽量少匹配；而默认情况下，这些符号是贪婪的，尽可能多地匹配。 5. **点号`.` 的匹配**: - `.` 通常匹配任何单个字符，除了换行符。如果需要匹配包括换行在内的任意字符，可以使用 `(.)|(\n)` 的模式。 6. **捕获组**: - `(pattern)` 创建一个捕获组，匹配后可以获取到这一组匹配的内容，如在VBScript中的`SubMatches`或JScript中的`$0`至`$9`属性。如果需要匹配括号字符本身，应使用`$`和`$`。 7. **非捕获组**: - `(?:pattern)` 不创建新的捕获组，这样可以避免在后续操作中干扰原始匹配结果。这些知识点展示了正则表达式的基础语法和常用功能，对于处理文本数据、解析URL、验证表单输入等场景非常实用。深入理解这些规则有助于编写更高效和灵活的文本处理程序。

表达式全集

字符

描述

将下一个字符标记为一个特殊字符、或一个原义字符、或一个

向后引用、或一个八进制转义符。例如，“n”匹配字符“n”。“”

匹配一个换行符。串行“\”匹配“\”而“\(”则匹配“(”。

匹配输入字符串的开始位置。如果设置了 RegExp 对象的

Multiline 属性，^也匹配“”或“ ”之后的位置。

匹配输入字符串的结束位置。如果设置了 RegExp 对象的

Multiline 属性，$也匹配“”或“ ”之前的位置。

匹配前面的子表达式零次或多次。例如，zo*能匹配“z”以及

“zoo”。*等价于{0,}。

匹配前面的子表达式一次或多次。例如，“zo+”能匹配“zo”以及

“zoo”，但不能匹配“z”。+等价于{1,}。

匹配前面的子表达式零次或一次。例如，“do(es)?”可以匹配

“does”或“does”中的“do”。?等价于{0,1}。

{n}

n 是一个非负整数。匹配确定的 n 次。例如，“o{2}”不能匹配

“Bob”中的“o”，但是能匹配“food”中的两个 o。

{n,}

n 是一个非负整数。至少匹配 n 次。例如，“o{2,}”不能匹配

“Bob”中的“o”，但能匹配“foooood”中的所有 o。“o{1,}”等价于

“o+”。“o{0,}”则等价于“o*”。

{n,m}

m 和 n 均为非负整数，其中 n<=m。最少匹配 n 次且最多匹配 m

次。例如，“o{1,3}”将匹配“fooooood”中的前三个 o。“o{0,1}”等

价于“o?”。请注意在逗号和两个数之间不能有空格。

当该字符紧跟在任何一个其他限制符（*,+,?，{n}，{n,}，{n,m}）

后面时，匹配模式是非贪婪的。非贪婪模式尽可能少的匹配所

搜索的字符串，而默认的贪婪模式则尽可能多的匹配所搜索的

字符串。例如，对于字符串“oooo”，“o+?”将匹配单个“o”，而“o+”

将匹配所有“o”。

匹配除“\

”之外的任何单个字符。要匹配包括“\

”在内的任何字

符，请使用像“(.|)”的模式。

(pattern)

匹配 pattern 并获取这一匹配。所获取的匹配可以从产生的

Matches 集合得到，在 VBScript 中使用 SubMatches 集合，在

JScript 中则使用$0…$9 属性。要匹配圆括号字符，请使用“\(”

或“\)”。

(?:pattern)

匹配 pattern 但不获取匹配结果，也就是说这是一个非获取匹

配，不进行存储供以后使用。这在使用或字符“(|)”来组合一个

模式的各个部分是很有用。例如“industr(?:y|ies)”就是一个比

“industry|industries”更简略的表达式。

下载后可阅读完整内容，剩余3页未读，立即下载

xiaoshun007～

粉丝: 4128

正则表达式全集：匹配与重复规则详解

正则表达式.docx

正则表达式大全.docx

java正则表达式使用.docx

如果是一个文件夹里所包含的.docx ，如何可以使用正则表达式来提取姓名和学号

python用正则表达式读取docx文件的某一行到某一行的内容

正则表达式去除文件的后缀名

java定义正则表达式

正则表达式是什么？通配符是什么？举例说明两者语法有什么区别。

python正则表达式匹配docx文件 如何优化 提高速度

正则表达式文件名合法

最新资源

python正则表达式匹配docx文件如何优化提高速度