bs4的xpath语法如何获取标签内除去br标签以外的所有内容
时间: 2023-07-16 21:13:45 浏览: 159
利用xpath提取标签下所有文本
在BeautifulSoup4中,可以使用`get_text()`方法来获取标签内的所有文本内容。如果要排除某些标签,可以将这些标签名传递给`exclude`参数。例如,要获取除去`br`标签以外的所有文本内容,可以使用以下代码:
```python
from bs4 import BeautifulSoup
html = """
<div>
<p>This is some text.</p>
<br>
<p>More text.</p>
</div>
"""
soup = BeautifulSoup(html, 'html.parser')
text = soup.div.get_text(exclude=['br'])
print(text)
```
输出结果为:
```
This is some text.
More text.
```
在这个例子中,我们首先使用`BeautifulSoup`解析了一个HTML字符串。然后,我们选择了`div`标签,并使用`get_text()`方法来获取除去`br`标签以外的所有文本内容。最后,我们将结果输出到控制台。
阅读全文