我想提取span标签的内容,结果不带<span>标签,请一个正则表达式
时间: 2024-05-02 21:17:06 浏览: 89
正则表达式获取HTML标签内容
可以正则表达式来匹配并替换掉 `<span>` 标签,只保留其中的文本内容。例如:
```python
import re
html_string = "<p>This is a <span>sample</span> text.</p>"
text_string = re.sub('<[^<]+?>', '', html_string)
print(text_string) # 输出:This is a sample text.
```
这里使用了 `re.sub()` 函数来替换掉所有的 HTML 标签,其中的正则表达式 `'<[^<]+?>'` 可以匹配任何以 `<` 开头、以 `>` 结尾的字符串,也就是 HTML 标签。替换成空字符串后,就只剩下了标签中间的文本内容。
阅读全文