如何用bs4筛选HTML文本内容?
时间: 2023-07-12 15:17:16 浏览: 90
06.bs4解析-bs4模块安装和使用1
使用bs4筛选HTML文本内容的步骤如下:
1. 导入BeautifulSoup模块
```python
from bs4 import BeautifulSoup
```
2. 使用BeautifulSoup解析HTML文本
```python
soup = BeautifulSoup(html, 'html.parser')
```
其中,`html`是HTML文本,`html.parser`是解析器。
3. 根据需要筛选HTML内容
可以使用以下方法:
- `find()`: 返回匹配到的第一个元素
- `find_all()`: 返回匹配到的所有元素
- `select()`: 返回匹配到的所有元素,使用CSS选择器语法
例如,如果要筛选所有的`<a>`标签,可以使用以下代码:
```python
links = soup.find_all('a')
```
如果要筛选class为`title`的所有`<h1>`标签,可以使用以下代码:
```python
titles = soup.select('h1.title')
```
其中,`h1.title`表示选择所有class为`title`的`<h1>`标签。
注意:在使用`select()`方法时,需要注意CSS选择器的语法规则。
阅读全文