Java正则表达式完全解析

需积分: 13 2 下载量 92 浏览量 更新于2024-09-08 收藏 80KB DOC 举报
Java中的正则表达式是一种强大的文本处理工具,用于在字符串中搜索、替换和提取符合特定模式的文本。正则表达式是由特殊字符和普通字符组成的模式,这些模式描述了一组要匹配的字符串。 1. 英文句点(`.`):在正则表达式中,句点通常用来匹配除了换行符之外的任何单个字符。例如,表达式"t.o"将匹配以't'开头,然后是任意一个字符,最后是'o'的字符串,如"tno"、"t#o"、"teo"等,但不会匹配"tnno"、"to"、"Tno"、"t正o"等。 2. 方括号(`[]`):方括号用于定义一个字符集,匹配其中的任意一个字符。如"t[abcd]n"只能匹配"tan"、"tbn"、"tcn"、"tdn",而不能匹配"thn"或"tabn"等。 3. 或符号(`|`):`|`表示逻辑或,它允许你在一组字符中选择一个进行匹配。例如,"t(a|b|c|dd)n"将匹配"tan"、"tbn"、"tcn"或"tddn",但不会匹配"taan"、"tn"或"tabcn"。 4. 匹配次数的符号:`{n,}`表示至少匹配n次。例如,"[0—9]{3}\—[0-9]{2}\—[0-9]{3}"将匹配格式为"999—99—999"的电话号码,其中"-"需要转义为"\—"以避免被解释为范围。 5. `^`符号:当在方括号内使用时,`^`表示否定,意味着不想匹配的字符。例如,`[^x]`表示除'x'之外的任何单个字符。 6. 圆括号(`()`)和空白符号:`\s`匹配单个空格、制表符、回车符或换页符。圆括号用于分组,可以捕获匹配的子串,方便后续操作。 7. 正则表达式的快捷符号: - `\d`相当于`[0-9]`,匹配数字。 - `\D`相当于`[^0-9]`,匹配非数字。 - `\w`相当于`[0-9A-Za-z_]`,匹配字母、数字或下划线。 - `\W`相当于`[^0-9A-Za-z_]`,匹配非字母、数字或下划线字符。 - `\s`相当于`[\t\n\r\f]`,匹配空白字符。 - `\S`相当于`[^[\t\n\r\f]]`,匹配非空白字符。 8. 常用正则表达式实例: - "Java:(([a-z]|_)(\\w*){6,20})" 用于匹配以字母或下划线开头,由6到20个字母、数字或下划线组成的字符串。 - "JavaScript:/^(-)?(\d+)$/" 匹配整数,负数或正数。 - "/^\w+$/" 匹配由字母、数字或下划线组成的字符串。 - ".+" 匹配一个或多个任意字符。 - "/0" 提取第一次匹配的字符串。 9. 在Java中使用正则表达式: - 示例1: ```java Pattern p = Pattern.compile("t.n"); Matcher m = p.matcher("ton"); if (m.matches()) { return true; } ``` - 示例2: ```java boolean bool = Pattern.matches("t.n", "ton"); ``` 这些示例演示了如何编译和使用正则表达式来检查字符串是否符合给定的模式。`matches()`方法会检查整个字符串是否完全匹配该模式。 正则表达式在Java中的应用非常广泛,不仅限于简单的字符串匹配,还可以用于复杂的文本分析、数据验证、日志分析等多种场景。通过熟练掌握正则表达式,开发者可以更高效地处理字符串操作,提高代码的可读性和维护性。