html_doc = '<a href="https://www.example.com">Example</a><a href="https://www.google.com">Google</a>'这句如何传入一个网址
时间: 2023-11-06 11:07:21 浏览: 144
html转成doc
4星 · 用户满意度95%
如果您想要将一个 URL 的 HTML 内容传入 `BeautifulSoup` 进行解析,可以使用 `requests` 库发送 HTTP GET 请求获取网页内容,再将获取的 HTML 内容传入 `BeautifulSoup` 进行解析。具体操作如下:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://www.example.com'
response = requests.get(url)
html_doc = response.text
soup = BeautifulSoup(html_doc, 'html.parser')
a_tags = soup.find_all('a')
hrefs = [a.get('href') for a in a_tags]
print(hrefs) # 输出包含所有 href 属性的列表
```
代码中,我们首先定义一个 URL,然后使用 `requests` 库发送 HTTP GET 请求获取网页内容,将获取的 HTML 内容赋值给 `html_doc` 变量。接着,我们将 `html_doc` 传入 `BeautifulSoup` 类中进行解析,然后使用 `find_all` 方法找到所有 `<a>` 标签。最后,我们使用列表推导式对所有 `<a>` 标签的 `href` 属性进行提取,得到一个包含所有 `href` 属性的列表。
阅读全文