首页python 利用requests爬取网站数据的代码范例

python 利用requests爬取网站数据的代码范例

时间: 2023-08-28 17:03:58 浏览: 119

以下是一个简单的 Python 爬虫代码范例，使用 requests 库爬取一个网站的数据： ```python import requests from bs4 import BeautifulSoup # 发送 GET 请求，获取网页内容 url = 'https://www.example.com' response = requests.get(url) # 使用 BeautifulSoup 解析 HTML soup = BeautifulSoup(response.text, 'html.parser') # 提取所需的数据 title = soup.title.text content = soup.find('div', class_='content').text # 输出结果 print('网页标题：', title) print('网页正文：', content) ``` 这段代码首先使用 requests 库发送 GET 请求，获取指定网站的内容。然后使用 BeautifulSoup 解析 HTML，提取出所需的数据。最后输出结果。需要注意的是，爬取网站的过程中可能会存在反爬虫机制，需要针对不同的网站进行不同的处理，例如添加 User-Agent、延时、使用代理等。另外，爬取网站的数据可能存在版权等法律问题，请在遵守相关法律法规的前提下使用爬虫工具。

阅读全文