.extract() 是什么用法
时间: 2024-06-09 21:07:32 浏览: 5
`.extract()` 是 Python 中 BeautifulSoup 库中的一个方法,用于提取 HTML 文档中的某个标签或属性的内容,并将其返回为一个字符串或列表。
例如,如果想要从 HTML 文档中提取所有的链接,可以使用以下代码:
```python
from bs4 import BeautifulSoup
html_doc = """
<html>
<body>
<a href="http://www.example.com/page1.html">Page 1</a>
<a href="http://www.example.com/page2.html">Page 2</a>
<a href="http://www.example.com/page3.html">Page 3</a>
</body>
</html>
"""
soup = BeautifulSoup(html_doc, 'html.parser')
links = []
for link in soup.find_all('a'):
links.append(link.get('href'))
print(links)
```
运行结果为:
```
['http://www.example.com/page1.html', 'http://www.example.com/page2.html', 'http://www.example.com/page3.html']
```
在上述代码中,`soup.find_all('a')` 返回所有的 `<a>` 标签,`link.get('href')` 返回每个标签中的 `href` 属性的值,最后将所有的链接存储在一个列表中,输出结果。
相关推荐
![](https://img-home.csdnimg.cn/images/20210720083646.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)