请告诉我beautifulsoup的所有用法
时间: 2023-12-18 12:02:19 浏览: 71
BeautifulSoup是一个Python库,用于从HTML和XML文档中提取数据。以下是BeautifulSoup的一些常见用法:
1. 解析HTML/XML文档
```python
from bs4 import BeautifulSoup
# 解析HTML文档
soup = BeautifulSoup(html_doc, 'html.parser')
# 解析XML文档
soup = BeautifulSoup(xml_doc, 'xml')
```
2. 通过标签名获取元素
```python
# 通过标签名获取单个元素
soup.find('tag')
# 通过标签名获取多个元素
soup.find_all('tag')
```
3. 通过类名获取元素
```python
# 通过类名获取单个元素
soup.find(class_='class_name')
# 通过类名获取多个元素
soup.find_all(class_='class_name')
```
4. 通过属性获取元素
```python
# 通过属性获取单个元素
soup.find(attrs={'attr_name': 'attr_value'})
# 通过属性获取多个元素
soup.find_all(attrs={'attr_name': 'attr_value'})
```
5. 获取元素的文本内容
```python
# 获取单个元素的文本内容
soup.find('tag').text
# 获取多个元素的文本内容
[tag.text for tag in soup.find_all('tag')]
```
6. 获取元素的属性值
```python
# 获取单个元素的属性值
soup.find('tag')['attr_name']
# 获取多个元素的属性值
[tag['attr_name'] for tag in soup.find_all('tag')]
```
7. 修改元素的属性值
```python
# 修改单个元素的属性值
soup.find('tag')['attr_name'] = 'new_attr_value'
# 修改多个元素的属性值
for tag in soup.find_all('tag'):
tag['attr_name'] = 'new_attr_value'
```
8. 创建新元素
```python
# 创建新的元素
new_tag = soup.new_tag('tag', attr_name='attr_value')
# 将新元素添加到文档中
soup.body.append(new_tag)
```
这些是BeautifulSoup的一些常见用法,还有很多其他的用法和技巧。可以查看官方文档来了解更多信息。
阅读全文