python 利用requests爬取网站数据的代码范例
时间: 2023-08-28 17:03:58 浏览: 119
以下是一个简单的 Python 爬虫代码范例,使用 requests 库爬取一个网站的数据:
```python
import requests
from bs4 import BeautifulSoup
# 发送 GET 请求,获取网页内容
url = 'https://www.example.com'
response = requests.get(url)
# 使用 BeautifulSoup 解析 HTML
soup = BeautifulSoup(response.text, 'html.parser')
# 提取所需的数据
title = soup.title.text
content = soup.find('div', class_='content').text
# 输出结果
print('网页标题:', title)
print('网页正文:', content)
```
这段代码首先使用 requests 库发送 GET 请求,获取指定网站的内容。然后使用 BeautifulSoup 解析 HTML,提取出所需的数据。最后输出结果。
需要注意的是,爬取网站的过程中可能会存在反爬虫机制,需要针对不同的网站进行不同的处理,例如添加 User-Agent、延时、使用代理等。另外,爬取网站的数据可能存在版权等法律问题,请在遵守相关法律法规的前提下使用爬虫工具。
阅读全文