首页如果通过正则获取某个类名的div里的内容，比如获取<div class="signature><div>124</div></div>里<div class="signature></div>里的代码

如果通过正则获取某个类名的div里的内容，比如获取<div class="signature><div>124</div></div>里<div class="signature></div>里的代码

时间: 2023-11-02 22:05:06 浏览: 66

网站获取文本（正则表达式）代码

利用正则表达式获取网页文本，标题，内容，链接。已运行成功，无任何问题。

你可以使用正则表达式来提取特定类名的 `<div>` 标签内容。下面是一个示例代码： ```python import re html = '<div class="signature"><div>124</div></div>' class_name = "signature" pattern = fr'<div class="{class_name}".*?>(.*?)</div>' result = re.search(pattern, html) if result: content = result.group(1) print(content) else: print("未找到匹配的内容") ``` 在上面的示例中，我们使用 `re.search()` 方法来查找符合指定类名的 `<div>` 标签。`pattern` 变量使用了 f-string 格式化字符串，以动态插入类名。然后，我们使用 `(.*?)` 来捕获 `<div>` 标签内的内容，并通过 `result.group(1)` 来获取捕获的内容。注意，使用正则表达式来解析 HTML 并不是最佳的方法。更好的选择是使用 HTML 解析库，如 Beautiful Soup，可以更方便地处理和提取 HTML 内容。

阅读全文