import requests from bs4 import BeautifulSoup from threading import Thread def crawl_books(start, end): for i in range(start, end): url = 'http://search.dangdang.com/?key=%BC%C6%CB%E3%BB%FA&act=input&page_index={}'.format(i) response = requests.get(url) page = response.text soup = BeautifulSoup(page, 'lxml') books = soup.find('ul', class_='bigimg') for book in books.find_all('li'): title = book.find('a', class_='pic').get('title') author = book.find('p', class_='search_book_author').text price = book.find('p', class_='price').find('span', class_='search_now_price').text book_link = 'https:' + book.find('a', class_='pic').get('href') response = requests.get(book_link) page = response.text soup = BeautifulSoup(page, 'lxml') comment_num = soup.find('a', class_='review_num').text print(title, author, price, comment_num) threads = [] for i in range(1, 101, 10): t = Thread(target=crawl_books, args=(i, i+10)) threads.append(t) t.start() for t in threads: t.join()修改

时间: 2024-02-29 08:53:57 浏览: 83

python调试文件时发生import requests报错.doc

5星 · 资源好评率100%

Python 调试文件时发生 Import Requests 报错解决方法在 Python 调试文件时，如果碰到 Import Requests 报错，可能是因为 Python 环境中没有安装 Requests 库所致。解决这个问题需要完成 pip 安装过程，下面是详细的解决步骤。环境变量配置在安装 Requests 库之前，需要先配置环境变量。环境变量是操作系统中的一种设置，用于存储一些常用的变量，方便在命令行中使用。在 Windows 系统中，配置环境变量的步骤如下： 1. 右键点击“我的电脑”，选择“属性”； 2. 点击“高级系统设置”； 3. 点击“环境变量”； 4. 在“系统变量”中，添加一个新的变量，变量名为 PATH，变量值为 Python 安装目录下的 Scripts 路径，例如 C:\Python37\Scripts。 pip 安装 Requests 库配置环境变量后，下一步是使用 pip 安装 Requests 库。pip 是 Python 的包管理工具，用于安装和管理 Python 库。下面是使用 pip 安装 Requests 库的步骤： 1. 打开命令提示符，输入 cmd 并回车，打开命令行窗口； 2. 使用 cd 命令切换到 Python 安装目录下的 Scripts 路径，例如 cd C:\Python37\Scripts； 3. 输入 pip 并回车，pip 会调用远程文件，下载并安装 Requests 库。 pip 安装 Requests 库的详细过程在使用 pip 安装 Requests 库时，需要注意以下几个步骤： 1. 打开命令提示符，输入 cmd 并回车，打开命令行窗口； 2. 使用 cd 命令切换到 Python 安装目录下的 Scripts 路径，例如 cd C:\Python37\Scripts； 3. 输入 pip 并回车，pip 会调用远程文件，下载并安装 Requests 库。 Requests 库的作用 Requests 库是一个 Python 库，用于发送 HTTP 请求。它提供了一个简单、灵活的方式来发送 HTTP 请求，例如 GET、POST、PUT、DELETE 等。Requests 库广泛应用于 Web 开发、爬虫、自动化测试等领域。 pip 的作用 pip 是 Python 的包管理工具，用于安装和管理 Python 库。pip 提供了一个简单、方便的方式来安装和管理 Python 库，例如 Requests 库。pip 广泛应用于 Python 开发、自动化测试等领域。总结在 Python 调试文件时，如果碰到 Import Requests 报错，需要先配置环境变量，然后使用 pip 安装 Requests 库。pip 是 Python 的包管理工具，用于安装和管理 Python 库。Requests 库是一个 Python 库，用于发送 HTTP 请求。

根据错误信息 `'NoneType' object has no attribute 'text'`，我们可以猜测问题出在找不到评论数量上。你可以添加一些条件来检查是否能够成功找到评论数量，例如： ``` comment_num_tag = soup.find('a', class_='review_num') if comment_num_tag: comment_num = comment_num_tag.text else: comment_num = '0' ``` 完整代码如下： ```python import requests from bs4 import BeautifulSoup from threading import Thread def crawl_books(start, end): for i in range(start, end): url = 'http://search.dangdang.com/?key=%BC%C6%CB%E3%BB%FA&act=input&page_index={}'.format(i) response = requests.get(url) page = response.text soup = BeautifulSoup(page, 'l

阅读全文

相关推荐

Requests_from_file-2.2: Python库文件下载与使用指南

ScrapeGen：基于Python requests和BeautifulSoup的网络抓取工具生成器

python_crawl_webtoon-源码

Python中的网络爬虫：Requests与BeautifulSoup

优化BeautifulSoup爬虫的策略：减少网络请求次数

多线程与并发编程：Python模块Threading的使用方法

多线程编程深度解读：threading与concurrent.futures的实战对比

使用BeautifulSoup进行网页链接爬取时的常见挑战与解决

Python爬虫开发：从入门到实战

用Python写一个多线程程序，爬取并Python的整个官网，要同时保存css、js和图片信息。注意程序中不要用beautifulsoup解析html，换成lxml的xpath进行解析。

BS4快速入门：解析HTML与XML的利器

最新推荐

YOLO算法-城市电杆数据集-496张图像带标签-电杆.zip

(177406840)JAVA图书管理系统毕业设计(源代码+论文).rar

(35734838)信号与系统实验一实验报告

YOLO算法-椅子检测故障数据集-300张图像带标签.zip

基于小程序的新冠抗原自测平台小程序源代码（java+小程序+mysql+LW）.zip

Java毕业设计项目：校园二手交易网站开发指南

管理建模和仿真的文件

【MVC标准化：肌电信号处理的终极指南】：提升数据质量的10大关键步骤与工具

能否提供一个在R语言中执行Framingham数据集判别分析的详细和完整的代码示例？

Blaseball Plus插件开发与构建教程