首页python爬虫当当新书榜单

python爬虫当当新书榜单

时间: 2023-08-28 13:21:18 浏览: 210

为了爬取当当新书榜单，你可以使用Python的Selenium库。以下是一个示例代码来爬取当当新书榜单的信息: ```python from selenium import webdriver from selenium.webdriver.support.ui import WebDriverWait from selenium.common.exceptions import TimeoutException import csv browser=webdriver.Chrome() wait=WebDriverWait(browser,10) def index_page(page): print('正在爬取第',page,'页') try: url='http://bang.dangdang.com/books/bestsellers/01.00.00.00.00.00-24hours-0-0-1-'+ str(page) browser.get(url) get_booklist() except TimeoutException: index_page(page) def get_booklist(): # 解析商品列表的代码 def saving_book(book): with open('data.csv', 'a', newline='')as csvfile: writer = csv.writer(csvfile) writer.writerow([book.get('排名'), book.get('书名'), book.get('图片'), book.get('评论数'), book.get('推荐'), book.get('作者'),book.get('原价'),book.get('折扣'),book.get('电子书')]) for page in range(1, 10): # 遍历每一页 index_page(page) ``` 为了运行这个代码，你需要安装Selenium库。你可以通过在终端运行`pip install selenium`来安装。另外，你还可以从PyPI下载Selenium对应的wheel文件，并使用pip进行安装。下载链接为：123 #### 引用[.reference_title] - *1* *2* *3* [Python爬虫——selenium爬取当当畅销图书排行](https://blog.csdn.net/weixin_52122271/article/details/120005188)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

阅读全文