举例说明bs4 select方法参数
时间: 2023-07-25 12:33:15 浏览: 46
BeautifulSoup4 (bs4) 是一个用于解析 HTML 和 XML 文档的 Python 库。其中的 select() 方法可以用于在 HTML 或 XML 文档中查找特定的元素。它的参数可以通过字符串或 CSS 选择器来指定。以下是两个示例:
1. 通过字符串指定参数:
```python
from bs4 import BeautifulSoup
html_doc = """
<html>
<head>
<title>这是标题</title>
</head>
<body>
<p class="content">这是段落1</p>
<p class="content">这是段落2</p>
<p class="content">这是段落3</p>
</body>
</html>
"""
soup = BeautifulSoup(html_doc, 'html.parser')
p_list = soup.select('p.content')
for p in p_list:
print(p.text)
```
输出结果:
```
这是段落1
这是段落2
这是段落3
```
2. 通过 CSS 选择器指定参数:
```python
from bs4 import BeautifulSoup
html_doc = """
<html>
<head>
<title>这是标题</title>
</head>
<body>
<p class="content">这是段落1</p>
<p class="content">这是段落2</p>
<p class="content">这是段落3</p>
</body>
</html>
"""
soup = BeautifulSoup(html_doc, 'html.parser')
p_list = soup.select('.content')
for p in p_list:
print(p.text)
```
输出结果:
```
这是段落1
这是段落2
这是段落3
```
在这两个示例中,都是通过 select() 方法的参数来查找 HTML 中的所有 `<p>` 元素,并且这些元素都有 `class="content"` 属性。第一个示例是通过字符串来指定参数,第二个示例是通过 CSS 选择器来指定参数,但是它们都可以得到相同的结果。