python爬虫代码完整版
时间: 2024-06-28 22:01:14 浏览: 179
python 爬虫代码
Python爬虫代码通常涉及使用一些库,如`requests`用于发送HTTP请求,`BeautifulSoup`或`pandas`处理HTML内容,以及`Scrapy`或`Selenium`进行更复杂的数据抓取。以下是一个简单的Python爬虫代码示例,用于从网页上抓取数据:
```python
# 导入必要的库
import requests
from bs4 import BeautifulSoup
# 定义目标URL
url = "https://example.com"
# 发送GET请求
response = requests.get(url)
# 检查请求是否成功(状态码为200表示成功)
if response.status_code == 200:
# 解析响应内容为BeautifulSoup对象
soup = BeautifulSoup(response.text, 'html.parser')
# 找到并提取需要的数据(假设我们寻找所有标题元素)
titles = soup.find_all('h1')
# 处理数据,这里打印标题
for title in titles:
print(title.text.strip())
else:
print(f"请求失败,状态码: {response.status_code}")
#
阅读全文