python中bs4怎么使用
时间: 2024-01-21 18:02:18 浏览: 24
在 Python 中使用 bs4(BeautifulSoup4)需要先安装该库。可以在终端使用以下命令进行安装:
```
pip install beautifulsoup4
```
安装完成之后,就可以在 Python 中使用 bs4 库进行解析 HTML 和 XML 代码了。以下是一个简单的示例:
```python
from bs4 import BeautifulSoup
# 创建一个 HTML 文档字符串
html_doc = """
<html>
<head>
<title>BeautifulSoup Demo</title>
</head>
<body>
<h1>BeautifulSoup Demo</h1>
<p class="desc">这是一个演示 BeautifulSoup 的 HTML 文档。</p>
<ul>
<li><a href="https://www.google.com">Google</a></li>
<li><a href="https://www.baidu.com">百度</a></li>
<li><a href="https://www.bing.com">Bing</a></li>
</ul>
</body>
</html>
"""
# 解析 HTML 代码
soup = BeautifulSoup(html_doc, 'html.parser')
# 获取标题
title = soup.title.string
print('标题:', title)
# 获取段落文本
desc = soup.find('p', {'class': 'desc'}).get_text()
print('段落:', desc)
# 获取所有链接
links = soup.find_all('a')
for link in links:
print(link.get('href'), link.string)
```
这个示例演示了如何使用 bs4 库来解析 HTML 文档,并获取其中的标题、段落和链接。具体使用时,可以根据需要进行调整。