selector = parsel.Selector(html_data) lis = selector.css('.list_item h2 a::attr(href)').getall() details = [] for li in lis: detail_url = 'https://travel.qunar.com' + li detail_html = requests.get(detail_url).text details.append(detail_html) time.sleep(random.randint(3, 5)) # 每次请求后等待一段时间，避免请求频繁被封 for detail_html in details: # 解析数据 detail_selector = parsel.Selector(detail_html) title = detail_selector.css('.b_crumb_cont *:nth-child(3)::text').get() comment = detail_selector.css('.title.white::text').get() view_count = detail_selector.css('.view_count::text').get() date = detail_selector.css('#js_mainleft > div.b_foreword > ul > li.f_item.when > p > span.data::text').get() days = detail_selector.css('#js_mainleft > div.b_foreword > ul > li.f_item.howlong > p > span.data::text').get() money = detail_selector.css('#js_mainleft > div.b_foreword > ul > li.f_item.howmuch > p > span.data::text').get() character = detail_selector.css('#js_mainleft > div.b_foreword > ul > li.f_item.who > p > span.data::text').get() play_list = detail_selector.css('#js_mainleft > div.b_foreword > ul > li.f_item.how > p > span.data > span::text').getall() for play in play_list: print(play) print(title, comment, view_count, date, days, money, character, play_list, detail_url)这段代码输出的文字可以匹配，但是网站都是同一个，要怎么改

import requests import random import parsel visited_urls = set() # 保存已经访问过的链接 page = 1 while True: # 循环爬取 url = f'https://travel.qunar.com/travelbook/list.htm?page={page}&order=hot_heat' html_data = requests.get(url).text selector = parsel.Selector(html_data) lis = selector.css('.list_item h2 a::attr(href)').getall() # 遍历当前页面中的所有链接 for li in lis: detail_url = 'https://travel.qunar.com' + li if detail_url in visited_urls: # 如果链接已经访问过，则跳过 continue visited_urls.add(detail_url) # 将链接加入集合中 detail_html = requests.get(detail_url).text time.sleep(random.randint(3, 5)) detail_selector = parsel.Selector(detail_html) title = detail_selector.css('.b_crumb_cont *:nth-child(3)::text').get() comment = detail_selector.css('.title.white::text').get() view_count = detail_selector.css('.view_count::text').get() date = detail_selector.css('#js_mainleft > div.b_foreword > ul > li.f_item.when > p > span.data::text').get() days = detail_selector.css('#js_mainleft > div.b_foreword > ul > li.f_item.howlong > p > span.data::text').get() money = detail_selector.css('#js_mainleft > div.b_foreword > ul > li.f_item.howmuch > p > span.data::text').get() character = detail_selector.css('#js_mainleft > div.b_foreword > ul > li.f_item.who > p > span.data::text').get() play_list = detail_selector.css('#js_mainleft > div.b_foreword > ul > li.f_item.how > p > span.data > span::text').getall() for play in play_list: print(play) print(title, comment, view_count, date, days, money, character, play_list, detail_url) time.sleep(random.randint(3, 5)) # 判断是否需要继续爬取 if len(lis) == 0 or page >= 20: break page += 1这段代码怎么将爬取出来的所有数据保存到csv文件

lis = selector.css('.list_item h2 a::attr(href)').getall() # 遍历当前页面中的所有链接 for li in lis: detail_url = 'https://travel.qunar.com' + li if detail_url in visited_urls: # 如果链接已经...

selector = parsel.Selector(resp.text)

这段代码使用了 Python 库 parsel 中的 Selector 类，用于从 HTTP 响应中提取数据。具体来说，它将 HTTP 响应的文本内容作为输入，创建一个 Selector 对象，然后可以使用该对象的方法和属性来定位和提取所需的...

job_link = driver.find_element_by_css_selector('.item_con_list li:first-child.p_top a span')修正成最新代码

job_link = driver.find_element(By.CSS_SELECTOR, '.item_con_list li:first-child.p_top a span') 其中，By 是从 selenium.webdriver.common.by 模块中导入的，用于指定元素定位方式。By.CSS_SELECTOR ...

Traceback (most recent call last): File "C:\Users\86182\PycharmProjects\pythonProject15\maoyan_100.py", line 20, in <module> selector = parsel.selector(html_date)#转换数据类型 TypeError: 'module' object is not callable这个怎么解决

这个错误通常是因为您在代码中使用了模块名而不是该模块中的函数名或类名。在这种情况下，您正在尝试将 parsel 模块转换为选择器，但是 parsel ...selector = Selector(html_data) 这应该解决您遇到的问题。

#解析数据 detail_selector = parsel.Selector(detail_html) title = detail_selector.css('.b_crumb_cont *:nth-child(3)::text').get() comment = detail_selector.css('.title white::text').get() view_count = detail_selector.css('.view_count::text').get() date = detail_selector.css('#js_mainleft > div.b_foreword > ul > li.f_item.when > p > span.data::text').get() days = detail_selector.css('#js_mainleft > div.b_foreword > ul > li.f_item.howlong > p > span.data::text').get() money = detail_selector.css('#js_mainleft > div.b_foreword > ul > li.f_item.howmuch > p > span.data::text').get() character = detail_selector.css('#js_mainleft > div.b_foreword > ul > li.f_item.who > p > span.data::text').get() play_list = detail_selector.css('#js_mainleft > div.b_foreword > ul > li.f_item.how > p > span.data > span::text').getall() for play in play_list: print(play) print(title, comment, view_count, date, days, money, character, play_list, detail_url) time.sleep(random.randint(3,5))这段代码为什么只能输出最后一个网站的内容，应该怎么修改

play_list = detail_selector.css('#js_mainleft > div.b_foreword > ul > li.f_item.how > p > span.data > span::text').getall() result_list = [] for play in play_list: result_dict = {} result_dict['...

price_info = driver.find_elements_by_css_selector(".priceInfo .totalPrice") ^ SyntaxError: invalid syntax

看起来你试图使用Selenium的find_elements_by_css_selector方法从网页上找到匹配特定CSS选择器的所有元素，但是price_info应该是变量名，而.通常用于访问DOM元素的属性，而不是用来开始一个新的表达式。...

DeprecationWarning: find_elements_by_css_selector is deprecated. Please use find_elements(by=By.CSS_SELECTOR, value=css_selector) instead job_list = driver.find_elements_by_css_selector(".job-card-wrapper")

这是一个编程类的问题，这个警告是告诉你使用 find_elements_by_css_selector 方法已经被弃用了，建议使用 find_elements 方法，通过 By.CSS_SELECTOR 参数指定选择器。你可以使用下面的代码替换原来的代码： job_...

DeprecationWarning: find_element_by_css_selector is deprecated. Please use find_element(by=By.CSS_SELECTOR, value=css_selector)

具体而言，您可以将代码中的 find_element_by_css_selector 替换为 find_element(by=By.CSS_SELECTOR, value=css_selector)，其中 css_selector 是您要查找的 CSS 选择器。示例代码： python from ...

element = driver.find_element_by_css_selector(".ant-btn.ant-btn-primary") NameError: name 'driver' is not defined

这个Python代码片段是在使用Selenium库进行网页自动化测试时，试图通过CSS选择器找到页面上某个类名为".ant-btn.ant-btn-primary"的元素。driver在这里应该是已经创建并初始化了一个Selenium WebDriver实例，用于...

input_box = driver.find_element_by_css_selector('.ChatSend-txt')

这段代码使用 Selenium 库中的 find_element_by_css_selector 方法来查找页面中 CSS 选择器为 .ChatSend-txt 的元素，并将其赋值给变量 input_box。通常情况下，这种定位方式用于自动化测试或者爬取网页数据时...

import requests import parsel import csv f = open('射击.csv', mode='w', encoding='utf-8-sig', newline='') csv_writer = csv.DictWriter(f, fieldnames=['游戏名字', '游戏地址']) csv_writer.writeheader() for page in range(1, 300): url = 'https://www.4399.com/flash_fl/4_1.htm'.format(page) headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36' } response = requests.get(url=url, headers=headers) response.encoding = response.apparent_encoding selector = parsel.Selector(response.text) lis = selector.css('#classic li') for li in lis: dit ={} data_url = li.css('a::attr(href)').get() new_url = 'http://www.4399.com' + data_url.replace('http://','/') dit['游戏地址'] = new_url title = li.css('img::attr(alt)').get() dit['游戏名字'] = title print(title, new_url) csv_writer.writerow(dit)怎么改成用xpath的

lis = selector.xpath('//*[@id="classic"]/li') for li in lis: dit = {} data_url = li.xpath('a/@href')[0] new_url = 'http://www.4399.com' + data_url.replace('http://', '/') dit['游戏地址'] = new_...

spans = driver.find_elements_by_css_selector('.job_request p span')修正成最新代码

spans = driver.find_elements_by_css_selector('.job_request > p > span') 这个选择器的意思是找到 class 为 job_request 的元素下的所有 p 元素下的 span 元素。其中 ">" 符号表示只选择直接子元素，避免...

lis = selector.css('.grid_view li')详细解释一下这段代码

这段代码使用了一个 CSS 选择器 '.grid_view li'，并将选择器匹配到的所有元素保存在名为 lis 的变量中。具体解释如下： - selector 是一个表示 HTML 或 XML 文档的解析树的对象，可以使用 CSS 选择器来定位...

bulletproof-nodejs：防弹node.js API的实现:shield_selector:

防弹Node.js架构 :shield_selector: 这是博客文章的示例存储库请阅读博客文章，以更好地了解服务器体系结构。另外，我在代码中添加了很多不在博客文章中的注释，因为它们解释了实现的原因以及选择库的原因以及...

selector=parsel.Selector(html_data)

selector = parsel.Selector(html_data) lis = selector.css('.list_item h2 a::attr(href)').getall() details = [] for li in lis: detail_url = 'https://travel.qunar.com'+ li detail_html = requests.get(detail_url).text只能输出最后一个域名的网站

相关推荐

selector=parsel.Selector(html_data)

selector = parsel.Selector(html_data) lis = selector.css('.list_item h2 a::attr(href)').getall() details = [] for li in lis: detail_url = 'https://travel.qunar.com'+ li detail_html = requests.get(detail_url).text只能输出最后一个域名的网站

相关推荐

Java_NIO-Selector.rar_java nio_selector

CSS selector:div.title p代表的是什么意思(通俗易懂)

Random-Selector-2.0.rar_Database1.laccdb_random

selector=parsel.Selector(html_data)这句代码什么意思，有什么用处

selector = parsel.Selector(resp.text)

job_link = driver.find_element_by_css_selector('.item_con_list li:first-child.p_top a span')修正成最新代码

Traceback (most recent call last): File "C:\Users\86182\PycharmProjects\pythonProject15\maoyan_100.py", line 20, in <module> selector = parsel.selector(html_date)#转换数据类型 TypeError: 'module' object is not callable这个怎么解决

price_info = driver.find_elements_by_css_selector(".priceInfo .totalPrice") ^ SyntaxError: invalid syntax

DeprecationWarning: find_elements_by_css_selector is deprecated. Please use find_elements(by=By.CSS_SELECTOR, value=css_selector) instead job_list = driver.find_elements_by_css_selector(".job-card-wrapper")

DeprecationWarning: find_element_by_css_selector is deprecated. Please use find_element(by=By.CSS_SELECTOR, value=css_selector)

element = driver.find_element_by_css_selector(".ant-btn.ant-btn-primary") NameError: name 'driver' is not defined

input_box = driver.find_element_by_css_selector('.ChatSend-txt')

spans = driver.find_elements_by_css_selector('.job_request p span')修正成最新代码

lis = selector.css('.grid_view li')详细解释一下这段代码

bulletproof-nodejs：防弹node.js API的实现:shield_selector:

最新推荐

LABVIEW程序实例-DS写属性数据.zip

毕设和企业适用springboot生鲜鲜花类及数据处理平台源码+论文+视频.zip

Windows平台下的Fastboot工具使用指南

管理建模和仿真的文件

DLMS规约深度剖析：从基础到电力通信标准的全面掌握

修改代码，使其正确运行

Python机器学习基础入门与项目实践

"互动学习：行动中的多样性与论文攻读经历"

【Shell脚本进阶】：wc命令行数统计的高级用法及解决方案

python编写一个程序，使得根据输入的起点和终点坐标值计算出坐标方位角