pythyon 正则 批量过滤指定html 标签
时间: 2023-05-12 22:07:07 浏览: 85
Python使用正则表达式过滤或替换HTML标签的方法详解
可以使用re模块中的sub函数,将指定的html标签替换为空字符串即可。以下是示例代码:
```python
import re
def filter_html_tags(html, tags):
"""
过滤指定的html标签
:param html: 待过滤的html字符串
:param tags: 要过滤的标签列表,如['div', 'span']
:return: 过滤后的html字符串
"""
pattern = '|'.join(map(re.escape, tags))
return re.sub(pattern, '', html)
# 示例用法
html = '<div><p>这是一段带有标签的html文本</p><span>这是一个span标签</span></div>'
filtered_html = filter_html_tags(html, ['div', 'span'])
print(filtered_html)
```
输出结果为:
```
<p>这是一段带有标签的html文本</p>
```
希望能对您有所帮助!
阅读全文