2023-06-11 00:48:41 [scrapy.downloadermiddlewares.redirect] DEBUG: Redirecting (301) to <GET https://www.qidian.com/rank/hotsales/page1> from <GET https://www.qidian.com/rank/hotsales?style=1&page=1>
时间: 2023-08-06 10:06:04 浏览: 93
这不是一个问题,而是Scrapy框架在运行时输出的一条调试信息。这里的调试信息是表示在处理请求时发生了一个重定向(301),将请求从原始的URL(`https://www.qidian.com/rank/hotsales?style=1&page=1`)重定向到了新的URL(`https://www.qidian.com/rank/hotsales/page1`)。这种情况通常是由于网站的URL重定向规则发生了变化,或者是网站的服务器配置发生了变化,导致原始的URL无法访问,需要重定向到新的URL。
如果您的抓取任务需要处理这种重定向,可以在Scrapy的配置文件中启用重定向中间件。如果您认为这个调试信息对您的任务没有帮助,可以忽略它。
相关问题
Filtered offsite request to 'product.dangdang.com': <GET http://product.dangdang.com/29370653.html> 2023-06-12 09:56:35 [scrapy.core.engine] INFO: Closing spider (finished)解释
这是 scrapy 爬虫框架的运行日志,其中包含了一条被过滤掉的请求记录。该请求是向 "product.dangdang.com" 发送了一个 GET 请求,请求的 URL 是 "http://product.dangdang.com/29370653.html"。这个请求被过滤掉了,可能是因为该网站不允许爬虫访问,或者该请求已经在其他地方被处理过了。日志的最后一行显示了爬虫已经运行完毕并被关闭。
['MOOCSpider.pipelines.TextPipeline', 'MOOCSpider.pipelines.MongoPipeline'] 2023-05-16 22:37:59 [scrapy.core.engine] INFO: Spider opened 2023-05-16 22:37:59 [scrapy.extensions.logstats] INFO: Crawled 0 pages (at 0 pages/min), scraped 0 items (at 0 items/min) 2023-05-16 22:37:59 [course] INFO: Spider opened: course 2023-05-16 22:37:59 [scrapy.extensions.telnet] INFO: Telnet console listening on 127.0.0.1:6023 2023-05-16 22:37:59 [scrapy.core.engine] DEBUG: Crawled (200) <POST https://www.icourse163.org/web/j/mocSearchBean.searchCourse.rpc?csrfKey=e3e6d578b16f42e7afe506ddae0ddd7b> (referer : None)
这是Scrapy爬虫框架输出的日志信息,它告诉我们爬虫程序已经启动并打开了一些管道(pipelines),包括文本管道(TextPipeline)和MongoDB管道(MongoPipeline),同时还监听了一个Telnet控制台。接着它向一个网站发送了一个POST请求,并收到了200的响应码。这个POST请求的目的可能是搜索相关的课程信息。