python爬虫入门案例
时间: 2024-06-21 08:00:59 浏览: 209
Python爬虫入门案例通常会从简单的网页抓取开始,比如获取HTML页面上的数据。这里我们可以用Python的requests库来发送HTTP请求,BeautifulSoup库来解析HTML内容。以下是一个基础的Python爬虫入门示例,用于抓取网站上的一段文本:
```python
# 导入必要的库
import requests
from bs4 import BeautifulSoup
# 定义目标URL
url = "https://example.com" # 请替换为你想要爬取的网站URL
# 发送GET请求并获取网页内容
response = requests.get(url)
# 检查请求是否成功
if response.status_code == 200:
# 使用BeautifulSoup解析HTML
soup = BeautifulSoup(response.text, 'html.parser')
# 找到需要的数据,这里假设我们想抓取页面标题
title = soup.find('title').text
# 输出或保存数据
print(f"抓取的页面标题:{title}")
else:
print("请求失败")