首页python正则表达式匹配html

python正则表达式匹配html

时间: 2023-10-26 18:27:53 浏览: 130

python 实现正则表达式匹配

# 问题描述 # 给定一个字符串 (s) 和一个字符模式 (p)。实现支持 '.' 和 '*' 的正则表达式匹配 # '.' 匹配任意单个字符。 # '*' 匹配零个或多个前面的元素。 # 匹配应该覆盖整个字符串 (s) ，而不是部分字符串 # 说明: # s 可能为空，且只包含从 a-z 的小写字母。 # p 可能为空，且只包含从 a-z 的小写字母，以及字符 . 和 *

你可以使用 Python 的 re 模块来进行正则表达式的匹配。如果想要匹配 HTML 标签，可以尝试以下代码片段： ```python import re # HTML 示例文本 html = "<p>Hello, <b>world</b>!</p>" # 定义正则表达式 pattern = "<.*?>" # 进行匹配 matches = re.findall(pattern, html) # 输出匹配结果 for match in matches: print(match) ``` 这个例子中，我们定义了一个正则表达式 `<.*?>` 来匹配 HTML 标签。通过调用 `re.findall()` 方法，我们可以获取到所有匹配的结果，并将其逐个打印出来。请注意，这只是一个简单的示例，对于复杂的 HTML 结构，可能需要更复杂的正则表达式或者使用专门的 HTML 解析库来处理。

阅读全文