首页python豆瓣登入爬虫代码

python豆瓣登入爬虫代码

时间: 2024-06-19 09:03:26 浏览: 212

为了保证账号安全，豆瓣并不支持直接使用用户名和密码进行登陆。但是可以使用豆瓣提供的API进行模拟登陆。以下是一个简单的 Python 程序，用于使用账号密码进行模拟登陆并爬取个人主页信息： ``` import requests login_url = 'https://accounts.douban.com/j/mobile/login/basic' profile_url = 'https://www.douban.com/people/{}' # 账号密码 payload = { 'name': 'your_account', 'password': 'your_password', 'remember': 'false', } # 登陆请求头部 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36', 'Referer': 'https://accounts.douban.com/passport/login_popup?login_source=anony', } # 发送登陆请求 session = requests.Session() session.post(login_url, data=payload, headers=headers) # 获取个人主页信息 response = session.get(profile_url.format('your_username')) print(response.text) ``` 需要注意的是，豆瓣在使用模拟登陆时可能会有一些反爬虫的措施。因此在编写爬虫时需要注意请求头部信息的设置以及爬虫访问的频率。

阅读全文