用beautifulsoup 获取标签中的所有文字
时间: 2024-05-07 19:22:50 浏览: 110
BeautifulSoup 获取 a标签里的文本内容
可以使用 Beautiful Soup 对 HTML 进行解析,然后使用 `get_text()` 方法获取标签中的所有文字。
以下是示例代码:
```python
from bs4 import BeautifulSoup
html = """
<html>
<head>
<title>Beautiful Soup 示例</title>
</head>
<body>
<div>
<h1>这是标题</h1>
<p>这是一段文字</p>
</div>
</body>
</html>
"""
soup = BeautifulSoup(html, 'html.parser')
text = soup.get_text()
print(text)
```
输出结果:
```
Beautiful Soup 示例
这是标题
这是一段文字
```
可以看到,输出结果包含了 HTML 中所有标签中的文字。如果只需要特定标签中的文字,可以在 `get_text()` 方法中传入该标签的名称。例如,`soup.h1.get_text()` 只会输出 `<h1>` 标签中的文字。
阅读全文