JAVA 正则表达式,比较下面2个表达式的区别: 1、<(div|p|h1|h2|h3|h4|h5|h6|ul|ol|li|table|pre)[^>]*> 2、<[div|p|h1|h2|h3|h4|h5|h6|ul|ol|li|table|pre][^>]*>
时间: 2023-08-21 12:10:39 浏览: 166
JAVA与正则表达式
这两个正则表达式的区别在于字符类的使用方式不同。
1、`<(div|p|h1|h2|h3|h4|h5|h6|ul|ol|li|table|pre)[^>]*>`
这个正则表达式使用了圆括号,创建了一个捕获组 `(div|p|h1|h2|h3|h4|h5|h6|ul|ol|li|table|pre)`,用于匹配 div、p、h1、h2、h3、h4、h5、h6、ul、ol、li、table、pre 中的任意一个标签名。然后使用 `[^>]*` 匹配零个或多个非 ">" 字符。这个正则表达式会匹配包括起始标签和结束标签在内的整个标签。
2、`<[div|p|h1|h2|h3|h4|h5|h6|ul|ol|li|table|pre][^>]*>`
这个正则表达式没有使用圆括号,没有创建捕获组。它使用了字符类 `[div|p|h1|h2|h3|h4|h5|h6|ul|ol|li|table|pre]`,这个字符类内的内容实际上是一个字符集合,它会匹配其中的任意一个字符。然后使用 `[^>]*` 匹配零个或多个非 ">" 字符。这个正则表达式会匹配起始标签中的一个字符,而不是整个标签。
因此,这两个正则表达式的区别在于匹配的范围不同。第一个正则表达式会匹配整个标签(包括起始标签和结束标签),而第二个正则表达式只会匹配起始标签中的一个字符。根据你的需求,你需要选择适合的正则表达式来匹配你想要的内容。
阅读全文