首页python爬虫微博视频

python爬虫微博视频

时间: 2023-11-28 12:05:14 浏览: 120

以下是使用Python爬虫爬取微博视频的步骤： 1.安装必要的库：requests、beautifulsoup4、selenium和webdriver_manager。 2.使用Selenium和webdriver_manager打开Chrome浏览器，并模拟登录微博。 3.使用requests和beautifulsoup4获取微博主页的HTML代码，并解析出视频的URL。 4.使用requests下载视频，并保存到本地。下面是一个简单的示例代码，可以爬取指定微博用户的主页视频： ```python import os import time import requests from bs4 import BeautifulSoup from selenium import webdriver from webdriver_manager.chrome import ChromeDriverManager # 设置Chrome浏览器无界面模式 options = webdriver.ChromeOptions() options.add_argument('--headless') options.add_argument('--disable-gpu') # 使用webdriver_manager打开Chrome浏览器 driver = webdriver.Chrome(ChromeDriverManager().install(), options=options) # 模拟登录微博 driver.get('https://weibo.com/') time.sleep(10) # 等待手动登录 cookies = driver.get_cookies() session = requests.Session() for cookie in cookies: session.cookies.set(cookie['name'], cookie['value']) # 获取微博主页的HTML代码 url = 'https://weibo.com/xxx' # 替换为指定微博用户的主页链接 response = session.get(url) soup = BeautifulSoup(response.text, 'html.parser') # 解析出视频的URL video_urls = [] for video in soup.find_all('video'): video_url = video.get('src') if video_url: video_urls.append(video_url) # 下载视频 for i, video_url in enumerate(video_urls): response = session.get(video_url) with open(f'video_{i}.mp4', 'wb') as f: f.write(response.content) # 关闭浏览器 driver.quit() ```

阅读全文