pythyon 正则 批量过滤指定html 标签
时间: 2023-05-12 13:07:07 浏览: 55
可以使用re模块中的sub函数,将指定的html标签替换为空字符串即可。以下是示例代码:
```python
import re
def filter_html_tags(html, tags):
"""
过滤指定的html标签
:param html: 待过滤的html字符串
:param tags: 要过滤的标签列表,如['div', 'span']
:return: 过滤后的html字符串
"""
pattern = '|'.join(map(re.escape, tags))
return re.sub(pattern, '', html)
# 示例用法
html = '<div><p>这是一段带有标签的html文本</p><span>这是一个span标签</span></div>'
filtered_html = filter_html_tags(html, ['div', 'span'])
print(filtered_html)
```
输出结果为:
```
<p>这是一段带有标签的html文本</p>
```
希望能对您有所帮助!
相关问题
正则过滤html标签
可以使用正则表达式来过滤HTML标签,具体方法如下:
```python
import re
def remove_tags(html):
# 定义HTML标签的正则表达式
pattern = re.compile(r'<[^>]+>', re.S)
# 使用sub方法将HTML标签替换为空字符串
return pattern.sub('', html)
```
正则 批量 html 中 没有内容的标签
您好,我可以回答这个问题。如果您想要匹配批量 HTML 中没有内容的标签,可以使用正则表达式来实现。具体的正则表达式可以根据您的需求来编写,例如可以使用以下的正则表达式来匹配没有内容的 div 标签:
/<div[^>]*><\/div>/g
这个正则表达式可以匹配所有没有内容的 div 标签,并且可以批量处理 HTML 中的标签。希望这个回答能够帮助到您。