首页python 实现html页面解析

python 实现html页面解析

时间: 2024-01-05 15:12:11 浏览: 76

可以使用 Python 中的第三方库 BeautifulSoup 来解析 HTML 页面。它是一个功能强大的库，可以帮助我们轻松地从 HTML 页面中提取数据。下面是一个简单的示例代码，用于解析一个简单的 HTML 页面： ```python from bs4 import BeautifulSoup import requests # 发送 HTTP 请求获取 HTML 页面 url = 'https://www.example.com' response = requests.get(url) # 解析 HTML 页面 soup = BeautifulSoup(response.text, 'html.parser') # 打印页面标题 print(soup.title.text) # 打印所有链接 for link in soup.find_all('a'): print(link.get('href')) ``` 在这个示例中，我们首先使用 requests 库发送 HTTP 请求来获取 HTML 页面。然后，我们使用 BeautifulSoup 库将 HTML 页面解析为一个 BeautifulSoup 对象。最后，我们使用 BeautifulSoup 对象来提取页面标题和所有链接。需要注意的是，这个示例只是一个简单的演示，实际的 HTML 页面可能会更加复杂，需要根据具体情况进行处理。

阅读全文