python爬取百度云资源分享吧_python爬取百度云盘资源
时间: 2023-07-16 18:11:41 浏览: 145
在Python中爬取百度云资源需要使用到第三方库requests和BeautifulSoup。下面是一个简单的示例:
```python
import requests
from bs4 import BeautifulSoup
# 构造请求头
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'}
# 目标url
url = 'https://pan.baidu.com/s/1c2f1r0'
# 发送请求
response = requests.get(url, headers=headers)
# 解析网页内容
soup = BeautifulSoup(response.text, 'html.parser')
# 获取提取码
code = soup.find('span', class_='pickpw').get_text()
# 获取下载链接
link = soup.find('a', class_='btn btn-primary btn-xl g-clear download-btn')['href']
print('提取码:', code)
print('下载链接:', link)
```
需要注意的是,百度云盘会对用户的访问进行限制,如果爬虫过于频繁,可能会被封禁,因此在爬取时需要适当控制请求频率,避免被封禁。
阅读全文