python爬虫：有一个函数def scratch_page(keyword,keyword_sec, driver, url, page): 和 driver.get(url % (urllib.parse.quote(keyword+''+keyword_sec), page)) 和def goods(html): yield [title, discount_price, original_price, shop, monthly_sales] 根据上面的代码正确的完善下面的代码： items = goods(html) for item in items: goods_list.append([keyword , item[0],float(item[1].strip())) ，完善后可以实现通过两个关键字来爬取商品数据

时间: 2024-02-13 07:02:56 浏览: 170

Scratch.rar_Scratch2_scartch案例开发_scratch_scratch2.0_site:www.pud

可以按照以下的方式完善代码： ```python import urllib.parse def scratch_page(keyword, keyword_sec, driver, url, page): driver.get(url % (urllib.parse.quote(keyword + ' ' + keyword_sec), page)) html = driver.page_source return html def goods(html): # 在这里编写解析 html 的代码，提取商品数据 # 提取出的数据格式为 [title, discount_price, original_price, shop, monthly_sales] # 使用 yield 关键字将每个商品数据生成为一个生成器 pass # 完善以下代码 goods_list = [] driver = # 这里需要创建一个 WebDriver 对象 url = # 这里需要指定要爬取的网站的 URL for page in range(1, 10): # 假设要爬取前 10 页的数据 html = scratch_page(keyword, keyword_sec, driver, url, page) items = goods(html) for item in items: goods_list.append([keyword, item[0], float(item[1].strip())]) ``` 这里的 `keyword` 和 `keyword_sec` 分别代表两个关键字。`driver` 参数是一个 WebDriver 对象，需要根据爬取网站的具体情况进行初始化。`url` 是要爬取的网站的地址，需要根据具体情况指定。在循环中调用 `scratch_page` 函数可以获取每一页的数据，然后解析出商品数据，将其添加到 `goods_list` 列表中。最终可以得到一个包含了所有商品数据的列表。

阅读全文

相关推荐

Linux_From_Scratch.rar_From Scratch_linux_linux from scratch_scr

scratch3_python_kernel:适用于scratch3的python内核扩展

-Scratch News- BlueberryDan (E3_S1).sb3_.sb3_scratch_

ppm2.rar_https://ppm2.com_ppm image_ppm2----com_www. ppm 2.com_w

Code_ Chapter3.Scratch3_quiz_scratch_scratch3_

2019-13：:front-facing_baby_chick:Duck（Scratch clone）더덕이랑？

matlab人脸匹配代码-python_opencv_scratch:python_opencv_scratch

sneak_page:scratch_test_frontEnd

Scratch_3.29.1_Setup.zip

web_scratch_file_analyze:基于scratch_file_anlyze的可视化scratch文件分析器

machine_learning_from_scratch_matlab_python：Python中的矢量化机器学习:snake:从头开始

scratch_animated_gif_tutorials:从动GIF制作的Scratch编程教程

parrot wants apples copy.rar_Apples_scratch_scratch 游戏_scratch

deadwiki：:skull_and_crossbones_selector:死了简单的个人Wiki

Python库 | scratch_text_to_nums-0.1.1-py3-none-any.whl

1Scratch经典入门项目11项_perhapsqnm_scratch_scratch入门项目_源码.rar.rar

基于微信小程序的校园论坛；微信小程序；云开发；云数据库；云储存；云函数；纯JS无后台；全部资料+详细文档+高分项目.zip

单电阻采样 基于单电阻采样的相电流重构算法 keil完整工程 单电阻采样 f103的单电阻，完整工程，带文档，带硬件资料 f3平台的单电阻完整工程，代码详细注释 还有微芯的单电阻smo代码加文档

最新推荐

第十一届蓝桥杯大赛青少年组Scratch国赛真题.pdf

Scratch编程入门（全图版）

基于微信小程序的校园论坛；微信小程序；云开发；云数据库；云储存；云函数；纯JS无后台；全部资料+详细文档+高分项目.zip

GitHub图片浏览插件：直观展示代码中的图像

管理建模和仿真的文件

【OPPO手机故障诊断专家】：工程指令快速定位与解决

求[100，900]之间相差为12的素数对（注：要求素数对的两个素数均在该范围内）的个数

Android IPTV项目：直播频道的实时流媒体实现

"互动学习：行动中的多样性与论文攻读经历"

【OPPO手机工程模式终极指南】：掌握这些秘籍，故障排查不再难！

单电阻采样基于单电阻采样的相电流重构算法 keil完整工程单电阻采样 f103的单电阻，完整工程，带文档，带硬件资料 f3平台的单电阻完整工程，代码详细注释还有微芯的单电阻smo代码加文档