JAVA 正则表达式,比较下面2个表达式的区别: 1、<(div|p|h1|h2|h3|h4|h5|h6|ul|ol|li|table|pre)[^>]*> 2、<[div|p|h1|h2|h3|h4|h5|h6|ul|ol|li|table|pre][^>]*>
时间: 2023-08-21 16:10:39 浏览: 44
这两个正则表达式的区别在于字符类的使用方式不同。
1、`<(div|p|h1|h2|h3|h4|h5|h6|ul|ol|li|table|pre)[^>]*>`
这个正则表达式使用了圆括号,创建了一个捕获组 `(div|p|h1|h2|h3|h4|h5|h6|ul|ol|li|table|pre)`,用于匹配 div、p、h1、h2、h3、h4、h5、h6、ul、ol、li、table、pre 中的任意一个标签名。然后使用 `[^>]*` 匹配零个或多个非 ">" 字符。这个正则表达式会匹配包括起始标签和结束标签在内的整个标签。
2、`<[div|p|h1|h2|h3|h4|h5|h6|ul|ol|li|table|pre][^>]*>`
这个正则表达式没有使用圆括号,没有创建捕获组。它使用了字符类 `[div|p|h1|h2|h3|h4|h5|h6|ul|ol|li|table|pre]`,这个字符类内的内容实际上是一个字符集合,它会匹配其中的任意一个字符。然后使用 `[^>]*` 匹配零个或多个非 ">" 字符。这个正则表达式会匹配起始标签中的一个字符,而不是整个标签。
因此,这两个正则表达式的区别在于匹配的范围不同。第一个正则表达式会匹配整个标签(包括起始标签和结束标签),而第二个正则表达式只会匹配起始标签中的一个字符。根据你的需求,你需要选择适合的正则表达式来匹配你想要的内容。
相关问题
JAVA 正则表达式“</[div|p|h1|h2|h3|h4|h5|h6|ul|ol|li|table|pre]+[^>]*>”的含义
这个正则表达式的含义是匹配以 "</" 开头,后面跟着一个或多个 div、p、h1、h2、h3、h4、h5、h6、ul、ol、li、table、pre 中的一个或多个字符(不包括 ">"),然后可能会有零个或多个非 ">" 字符,最后以 ">" 结束的字符串。
与之前提到的正则表达式相比,这个正则表达式多了一个 [^>]* 部分,它表示匹配零个或多个非 ">" 字符。
因此,这个正则表达式可以用来匹配一些特定的 HTML 结束标签,要求结束标签的标签名由 div、p、h1、h2、h3、h4、h5、h6、ul、ol、li、table、pre 中的一个或多个字符组成,并且允许在标签名后面有零个或多个非 ">" 字符。最后以 ">" 结束。
请注意,这个正则表达式是对结束标签进行匹配,与开始标签的正则表达式不同。同时,这个正则表达式可能不适用于常规的 HTML 结构,而更适用于特定的情况或特殊的需求。
JAVA 正则表达式“</[div|p|h1|h2|h3|h4|h5|h6|ul|ol|li|table|pre]+(^>)*>”的含义
这个正则表达式的含义是匹配以 "</" 开头,后面跟着一个或多个 div、p、h1、h2、h3、h4、h5、h6、ul、ol、li、table、pre 中的一个或多个字符(不包括 ">"),然后可能会有零个或多个非 ">" 字符,最后以 ">" 结束的字符串。
它可以用来匹配一些特定的 HTML 结束标签,要求结束标签的标签名由 div、p、h1、h2、h3、h4、h5、h6、ul、ol、li、table、pre 中的一个或多个字符组成,并且允许在标签名后面有零个或多个非 ">" 字符。最后以 ">" 结束。
请注意,这个正则表达式是对结束标签进行匹配,与开始标签的正则表达式不同。同时,这个正则表达式可能不适用于常规的 HTML 结构,而更适用于特定的情况或特殊的需求。