requests和BeautifulSoup库用法
时间: 2024-02-26 07:53:03 浏览: 64
requests库是一个Python第三方库,用于发送HTTP请求。使用requests库可以方便地发送HTTP请求,包括GET、POST、PUT、DELETE等请求方法,还可以设置请求头、请求参数、请求体等。以下是使用requests库发送GET请求的示例代码:
```python
import requests
url = 'http://www.example.com'
response = requests.get(url)
print(response.text) # 打印响应内容
```
BeautifulSoup库是一个Python第三方库,用于解析HTML和XML文档。使用BeautifulSoup库可以方便地从HTML和XML文档中提取数据。以下是使用BeautifulSoup库解析HTML文档并提取数据的示例代码:
```python
from bs4 import BeautifulSoup
import requests
url = 'http://www.example.com'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# 提取标题和链接
for link in soup.find_all('a'):
print(link.get('href'), link.text)
```
以上代码中,使用`requests.get()`方法发送GET请求,并将响应内容传递给BeautifulSoup库进行解析。使用`find_all()`方法查找所有`<a>`标签,并使用`get()`方法获取`href`属性和标签文本。
阅读全文