如果通过正则获取某个类名的div里的内容,比如获取<div class="signature><div>124</div></div>里<div class="signature></div>里的代码
时间: 2023-11-02 22:05:06 浏览: 66
网站获取文本(正则表达式)代码
你可以使用正则表达式来提取特定类名的 `<div>` 标签内容。下面是一个示例代码:
```python
import re
html = '<div class="signature"><div>124</div></div>'
class_name = "signature"
pattern = fr'<div class="{class_name}".*?>(.*?)</div>'
result = re.search(pattern, html)
if result:
content = result.group(1)
print(content)
else:
print("未找到匹配的内容")
```
在上面的示例中,我们使用 `re.search()` 方法来查找符合指定类名的 `<div>` 标签。`pattern` 变量使用了 f-string 格式化字符串,以动态插入类名。然后,我们使用 `(.*?)` 来捕获 `<div>` 标签内的内容,并通过 `result.group(1)` 来获取捕获的内容。
注意,使用正则表达式来解析 HTML 并不是最佳的方法。更好的选择是使用 HTML 解析库,如 Beautiful Soup,可以更方便地处理和提取 HTML 内容。
阅读全文