python 读html
时间: 2023-10-26 14:02:09 浏览: 40
Python 可以使用多种方式读取和处理 HTML 文件,以下是几种常见的方法:
1. 使用 requests 库发送 HTTP 请求并获取 HTML 页面的内容:
```python
import requests
url = 'https://www.example.com'
response = requests.get(url)
# 打印 HTML 内容
print(response.text)
```
2. 使用 urllib 库读取 HTML 文件:
```python
from urllib.request import urlopen
url = 'https://www.example.com'
response = urlopen(url)
# 打印 HTML 内容
print(response.read().decode('utf-8'))
```
3. 使用 Beautiful Soup 库解析 HTML 文件:
```python
from bs4 import BeautifulSoup
import requests
url = 'https://www.example.com'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# 打印 HTML 内容中的所有链接
for link in soup.find_all('a'):
print(link.get('href'))
```
这些方法只是读取和处理 HTML 文件的基本方式,具体的实现还需要根据具体的需求来选择合适的方法。