JAVA 正则表达式“</[div|p|h1|h2|h3|h4|h5|h6|ul|ol|li|table|pre]+(^>)*>”的含义
时间: 2023-08-21 07:10:40 浏览: 280
这个正则表达式的含义是匹配以 "</" 开头,后面跟着一个或多个 div、p、h1、h2、h3、h4、h5、h6、ul、ol、li、table、pre 中的一个或多个字符(不包括 ">"),然后可能会有零个或多个非 ">" 字符,最后以 ">" 结束的字符串。
它可以用来匹配一些特定的 HTML 结束标签,要求结束标签的标签名由 div、p、h1、h2、h3、h4、h5、h6、ul、ol、li、table、pre 中的一个或多个字符组成,并且允许在标签名后面有零个或多个非 ">" 字符。最后以 ">" 结束。
请注意,这个正则表达式是对结束标签进行匹配,与开始标签的正则表达式不同。同时,这个正则表达式可能不适用于常规的 HTML 结构,而更适用于特定的情况或特殊的需求。
相关问题
JAVA 正则表达式“</[div|p|h1|h2|h3|h4|h5|h6|ul|ol|li|table|pre]+[^>]*>” 是否可以检测到非div|p|h1|h2|h3|h4|h5|h6|ul|ol|li|table|pre的其他标签
是的,这个正则表达式可以检测到非 div、p、h1、h2、h3、h4、h5、h6、ul、ol、li、table、pre 的其他标签。
该正则表达式的意思是匹配以 "</" 开头,后面跟着一个或多个 div、p、h1、h2、h3、h4、h5、h6、ul、ol、li、table、pre 中的一个或多个字符(不包括 ">"),然后可能会有零个或多个非 ">" 字符,最后以 ">" 结束的字符串。
因此,如果一个结束标签的标签名不是 div、p、h1、h2、h3、h4、h5、h6、ul、ol、li、table、pre 中的任何一个标签名,并且符合上述的结构要求,那么它将被匹配到。
请注意,这个正则表达式只能检测到符合特定结构的结束标签,并不能判断标签是否在实际的 HTML 结构中存在或是否是有效的标签。对于完整的 HTML 解析和分析,建议使用专门的 HTML 解析器或库。
JAVA 正则表达式“</[div|p|h1|h2|h3|h4|h5|h6|ul|ol|li|table|pre]+[^>]*>”的含义
这个正则表达式的含义是匹配以 "</" 开头,后面跟着一个或多个 div、p、h1、h2、h3、h4、h5、h6、ul、ol、li、table、pre 中的一个或多个字符(不包括 ">"),然后可能会有零个或多个非 ">" 字符,最后以 ">" 结束的字符串。
与之前提到的正则表达式相比,这个正则表达式多了一个 [^>]* 部分,它表示匹配零个或多个非 ">" 字符。
因此,这个正则表达式可以用来匹配一些特定的 HTML 结束标签,要求结束标签的标签名由 div、p、h1、h2、h3、h4、h5、h6、ul、ol、li、table、pre 中的一个或多个字符组成,并且允许在标签名后面有零个或多个非 ">" 字符。最后以 ">" 结束。
请注意,这个正则表达式是对结束标签进行匹配,与开始标签的正则表达式不同。同时,这个正则表达式可能不适用于常规的 HTML 结构,而更适用于特定的情况或特殊的需求。
阅读全文