beautifulsoup的使用
时间: 2023-11-29 09:39:37 浏览: 74
BeautifulSoup是一个用于解析HTML和XML文档的Python库。它提供了一种简单的方式来遍历HTML和XML文档的节点树,并提供了许多方法来搜索和修改这些节点。
以下是一些常见的BeautifulSoup用法:
1. 导入BeautifulSoup库
```python
from bs4 import BeautifulSoup
```
2. 创建BeautifulSoup对象
```python
soup = BeautifulSoup(html_doc, 'html.parser')
```
其中html_doc是一个字符串类型的HTML文档。
3. 查找标签
使用soup.find()方法查找单个标签:
```python
soup.find('title')
```
使用soup.find_all()方法查找多个标签:
```python
soup.find_all('a')
```
4. 获取标签的属性
```python
tag = soup.find('a')
tag['href']
```
5. 获取标签的内容
```python
tag = soup.find('title')
tag.string
```
6. 修改标签的内容
```python
tag = soup.find('title')
tag.string = 'new title'
```
7. 添加标签
```python
new_tag = soup.new_tag('a', href='http://www.example.com')
soup.body.append(new_tag)
```
8. 删除标签
```python
tag = soup.find('a')
tag.decompose()
```
这些只是BeautifulSoup的一些常见用法,它还有许多其他功能可以探索。
阅读全文