首页python 读html

python 读html

时间: 2023-10-26 14:02:09 浏览: 40

Python 可以使用多种方式读取和处理 HTML 文件，以下是几种常见的方法： 1. 使用 requests 库发送 HTTP 请求并获取 HTML 页面的内容： ```python import requests url = 'https://www.example.com' response = requests.get(url) # 打印 HTML 内容 print(response.text) ``` 2. 使用 urllib 库读取 HTML 文件： ```python from urllib.request import urlopen url = 'https://www.example.com' response = urlopen(url) # 打印 HTML 内容 print(response.read().decode('utf-8')) ``` 3. 使用 Beautiful Soup 库解析 HTML 文件： ```python from bs4 import BeautifulSoup import requests url = 'https://www.example.com' response = requests.get(url) soup = BeautifulSoup(response.text, 'html.parser') # 打印 HTML 内容中的所有链接 for link in soup.find_all('a'): print(link.get('href')) ``` 这些方法只是读取和处理 HTML 文件的基本方式，具体的实现还需要根据具体的需求来选择合适的方法。