s = html.xpath('//ul[@class="thrui"]/li/div[@class="th200"]/text()') 改错

在没有给出具体错误的情况下，我无法确定您想要修改的内容。但是，根据代码片段的语法，我猜测您可能是想更正xpath表达式的语法错误。如果您想获取所有class为"thrui"的ul元素下的class为"th200"的div元素的文本内容，正确的xpath表达式应该是： ``` s = html.xpath('//ul[@class="thrui"]/li/div[@class="th200"]/text()') ``` 请注意，xpath表达式中的引号必须是英文半角引号。

def parse(url): try: res = requests.get(url, headers=headers) html = etree.HTML(res.text) books = html.xpath('//ul[@class="bang_list clearfix bang_list_mode"]/li') for b in books: name = b.xpath('./div[@class="name"]/a/text()')[0] link = b.xpath('./div[@class="name"]/a/@href')[0] comment = b.xpath('./div[@class="star"]/a/text()')[0] author = b.xpath('./div[@class="publisher_info"][1]/a[1]/@title')[0] publisher = b.xpath('./div[@class="publisher_info"][2]/a/text()')[0] price_n = b.xpath('./div[@class="price"]/p[1]/span[@class="price_n"]/text()')[0] price_r = b.xpath('./div[@class="price"]/p[1]/span[@class="price_r"]/text()')[0]这段代码的意思

这段代码是一个Python函数，它接收一个URL参数，并使用requests库发送HTTP请求获取该URL对应的HTML网页。然后，使用etree库解析HTML文档，提取其中的书籍信息，并将其存储在一个字典中。具体来说，该函数首先通过XPath表达式选取所有包含书籍信息的<li>元素。然后，对于每个<li>元素，使用XPath表达式提取书名、链接、评论、作者、出版社、价格等信息，并将其存储在一个字典中。最后，将所有字典存储在一个列表中，作为函数的返回值。

for li in li_list: book_tag= li.xpath("//h1/text()").get().replace("豆瓣图书标签: ","") book_name = li.xpath("./div[@class='info']/h2/a/@title").get() # 书名 book_info = li.xpath(".//div[@class='pub']/text()").get() book_nums = li.xpath(".//span[@class='rating_nums']/text()").get() book_pl = li.xpath(".//span[@class='pl']/text()").get().strip().replace("(","").replace("人评价)","")

这段代码位于类 `DouBanBook` 中的 `parse_start_url` 方法中。它使用 XPath 表达式从标签页的响应中提取图书的相关信息。 - 对于每个 `li` 元素，在其下面进行如下操作： - 使用 `xpath` 方法选取 `h1` 元素，并使用 `get` 方法获取文本内容。然后，对该文本进行处理，去掉开头的 "豆瓣图书标签: "，得到 `book_tag`。 - 使用相对路径的 XPath 表达式选取 `div` 元素下的 `h2` 元素的 `a` 元素，并使用 `get` 方法获取 `title` 属性的值，即书名，赋值给 `book_name`。 - 使用相对路径的 XPath 表达式选取当前元素下的 `div` 元素中的 `pub` 类的文本内容，即书籍的信息，赋值给 `book_info`。 - 使用相对路径的 XPath 表达式选取当前元素下的 `span` 元素中的 `rating_nums` 类的文本内容，即书籍的评分，赋值给 `book_nums`。 - 使用相对路径的 XPath 表达式选取当前元素下的 `span` 元素中的 `pl` 类的文本内容，即书籍的评论人数，赋值给 `book_pl`。在处理前需要去除首尾空格，并替换掉括号和括号内的内容。这段代码的作用是从标签页中提取每本图书的标签、书名、信息、评分和评论人数。然后，将这些信息存储在相应的变量中。您还有其他问题吗？

阅读全文

s = html.xpath('//ul[@class="thrui"]/li/div[@class="th200"]/text()') 改错

相关推荐

Xml.zip文件：互联网/IE编程入门资料

ElemWhen.c分析：深入Linux/Unix编程中的xsl:when元素

掌握parsel：用XPath/CSS选择器轻松抓取XML/HTML数据

ext = selector.xpath('//div[@class="ind"]/div[@class="left"]/div[@class="gg"]/ul[1]/li[1]/a/text()')[0] IndexError: list index out of range

大家在看

电法正反演方法和软件使用介绍(“反演”文档)共33张.pptx

饿了么后端项目+使用VUE+Servlet+AJAX技术开发前后端分离的Web应用程序。

微软--项目管理软件质量控制实践篇（一）（二）（三）

chfenger-Waverider-master0_乘波体_

840D的PLC功能块FB2和FB3读写NC系统变量

最新推荐

java计算器源码.zip

FRP Manager-V1.19.2

CentOS 6下Percona XtraBackup RPM安装指南

【K-means与ISODATA算法对比】：聚类分析中的经典与创新

jupyter notebook没有opencv

QandAs问卷平台：基于React和Koa的在线调查工具

RLE编码与解码原理：揭秘BMP图像处理的关键步骤，提升解码效率

PHP XDEBUG

深入探究DotNetBar9.5源代码：打造专业Windows界面

【PRODAVE协议深度解析】：掌握S7-300 PLC通信的幕后英雄