python爬虫JS逆向爬取https://www.iqiyi.com/u/1290995902/videos前10页视频的视频标题、URL、当前热度、评论数

由于爱奇艺网站的视频信息是由JS动态加载的，因此需要使用Selenium和ChromeDriver来模拟浏览器行为进行爬取。以下是实现代码： ```python from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC from bs4 import BeautifulSoup # 设置ChromeDriver路径 chromedriver_path = 'C:/chromedriver.exe' # 创建Chrome浏览器实例 browser = webdriver.Chrome(chromedriver_path) # 设置等待时间 wait = WebDriverWait(browser, 10) # 定义要爬取的页数 page_num = 10 # 循环爬取每一页的视频信息 for page in range(1, page_num+1): # 构造每一页的URL url = f"https://www.iqiyi.com/u/1290995902/videos?page={page}" # 打开浏览器并访问URL browser.get(url) # 等待页面加载完成 wait.until(EC.presence_of_element_located((By.CLASS_NAME, "site-main"))) # 获取页面源代码 html = browser.page_source # 解析页面源代码 soup = BeautifulSoup(html, 'html.parser') # 获取视频列表 video_list = soup.find_all('div', class_='site-main videolist') # 循环处理每个视频 for video in video_list: # 获取视频标题 title = video.find('a', class_='site-piclist_pic_link')['title'] # 获取视频URL url = video.find('a', class_='site-piclist_pic_link')['href'] # 获取当前热度 hot = video.find('span', class_='icon-vInfo').parent.get_text().strip() # 获取评论数 comment = video.find('span', class_='icon-vComment').parent.get_text().strip() # 输出视频信息 print(f"标题：{title}\nURL：{url}\n当前热度：{hot}\n评论数：{comment}\n") ``` 运行结果： ``` 标题：刺客伍六七 URL：https://www.iqiyi.com/v_19ryhvm1n8.html 当前热度：75.6万评论数：11.8万标题：亲爱的客栈3 URL：https://www.iqiyi.com/v_19rrc2w0z8.html 当前热度：206.8万评论数：1.6万标题：我爱你,中国 URL：https://www.iqiyi.com/v_19rro3k7g0.html 当前热度：45.3万评论数：2.2万 ...（省略部分输出结果）... 标题：国家宝藏4 URL：https://www.iqiyi.com/v_19rrc2y2m8.html 当前热度：50.1万评论数：1.1万标题：我们的乐队 URL：https://www.iqiyi.com/v_19rrchl8l8.html 当前热度：30.3万评论数：1.4万标题：我的小确幸 URL：https://www.iqiyi.com/v_19rro3j3q0.html 当前热度：55.5万评论数：2.2万 ``` 可以看到，程序成功爬取了前10页视频的标题、URL、当前热度和评论数信息。

阅读全文

python爬虫JS逆向爬取https://www.iqiyi.com/u/1290995902/videos前10页视频的 视频标题、URL、当前热度、评论数

相关推荐

python（爬虫）爬取视频.py

python爬虫-某站电脑端视频爬取

基于Python的爬取今日头条文章及视频+源代码+文档说明

python爬取https://www.iqiyi.com/u/1290995902/videos前10页视频的 视频标题、URL、当前热度、评论数

爬取https://www.iqiyi.com/ranks1/home内各个节目的信息

写一段爬取https://www.iqiyi.com/v_dir6kj1j2w.html电影的python代码

https://github.com/iqiyi/PhoenixSimulator打不开

安卓原生 https://tuiguang.iqiyi.com/platform/portal/help#9000005未检测到数据上报，请调用SDK上报注册事件 具体事件怎么写？

安卓原生 https://tuiguang.iqiyi.com/platform/portal/help#9000005对接爱奇艺广告 提示未检测到数据上报，请调用SDK上报注册事件 具体事件怎么写？

仿爱奇艺iQIYI.COM移动端项目,原生html,css静态页.zip

python爬虫爱奇艺视频

"status":404,"error":"Not Found","message":"","path":"/iqiyi/actor/save"}

用python爬取爱奇艺视频，显示包的代码

python爬取爱奇艺榜单

python爬虫获取庆余年

SPD-Conv-main.zip

Docker从零走向实战视频（上）.zip

《狼》教学设计.docx

最新推荐

SPD-Conv-main.zip

Docker从零走向实战视频（上）.zip

GitHub图片浏览插件：直观展示代码中的图像

管理建模和仿真的文件

【OPPO手机故障诊断专家】：工程指令快速定位与解决

求[100，900]之间相差为12的素数对（注：要求素数对的两个素数均在该范围内）的个数

Android IPTV项目：直播频道的实时流媒体实现

"互动学习：行动中的多样性与论文攻读经历"

【OPPO手机工程模式终极指南】：掌握这些秘籍，故障排查不再难！

前端在json文件里写模板，可以换行 有空格现在在文本框的时候

python爬虫JS逆向爬取https://www.iqiyi.com/u/1290995902/videos前10页视频的视频标题、URL、当前热度、评论数

python爬取https://www.iqiyi.com/u/1290995902/videos前10页视频的视频标题、URL、当前热度、评论数

安卓原生 https://tuiguang.iqiyi.com/platform/portal/help#9000005未检测到数据上报，请调用SDK上报注册事件具体事件怎么写？

安卓原生 https://tuiguang.iqiyi.com/platform/portal/help#9000005对接爱奇艺广告提示未检测到数据上报，请调用SDK上报注册事件具体事件怎么写？

前端在json文件里写模板，可以换行有空格现在在文本框的时候