BeautifulSoup用法
时间: 2023-12-14 11:02:18 浏览: 80
BeautifulSoup用法详解1
BeautifulSoup是Python的一个HTML或XML解析库,它可以将HTML或XML文档解析成树形结构,方便我们对文档进行操作。
使用BeautifulSoup需要先安装,可以通过pip命令进行安装,如下所示:
```
pip install beautifulsoup4
```
安装完成后,我们可以导入BeautifulSoup类,并使用它来解析HTML或XML文档,如下所示:
```python
from bs4 import BeautifulSoup
# 解析HTML文档
html = """
<html>
<head>
<title>BeautifulSoup用法</title>
</head>
<body>
<div class="content">
<p>这是一个段落</p>
<ul>
<li>列表项1</li>
<li>列表项2</li>
<li>列表项3</li>
</ul>
</div>
</body>
</html>
"""
soup = BeautifulSoup(html, 'html.parser')
# 获取标题
title = soup.title.string
print(title)
# 获取段落内容
p = soup.find('p')
print(p.string)
# 获取列表项
lis = soup.find_all('li')
for li in lis:
print(li.string)
```
在上面的示例中,我们使用BeautifulSoup解析了一个HTML文档,并获取了标题、段落内容和列表项。其中,find方法可以根据标签名查找元素,find_all方法可以查找所有符合条件的元素。另外,string属性可以获取元素的文本内容。
阅读全文