bd_name = html.xpath("//td[@width='30%']/text()").get() bd_name1 = html.xpath("//td[@class='bdmc']/following-sibling::*[1]/text()").get('')

在给定的HTML文档中，这两行代码使用XPath选择器从HTML中提取信息。第一行代码： `bd_name = html.xpath("//td[@width='30%']/text()").get()` 这行代码使用XPath选择器选择`<td>`元素，并且该元素的`width`属性的值为`30%`。然后，`.get()`方法用于获取匹配到的元素的文本内容。所以，`bd_name`变量将包含所选元素的文本内容。第二行代码： `bd_name1 = html.xpath("//td[@class='bdmc']/following-sibling::*[1]/text()").get('')` 这行代码使用XPath选择器选择具有`class`属性值为`bdmc`的`<td>`元素。然后，`following-sibling::*[1]`表示选择该元素的下一个兄弟节点。最后，`.get('')`方法用于获取所选元素的文本内容，如果没有匹配到任何元素，则返回空字符串`''`。注意：以上代码中的`html`是HTML文档的变量名，你可以根据实际情况进行替换。

driver.get(url1) data = driver.page_source html = etree.HTML(data) auther_name = html.xpath('/html/body/table/tbody/tr/td[1]/a/text()') novel_name = html.xpath('/html/body/table/tbody/tr/td[2]/a/text()') novel_type_list = html.xpath('/html/body/table/tbody/tr/td[3]/text()') novel_type_list.pop(0) novel_type = []

这段代码的作用是使用 Selenium 和 XPath 技术，从一个小说网站爬取小说的作者名字、小说名字和小说类型，并将它们存储在 `auther_name`、`novel_name` 和 `novel_type` 变量中。其中 `url1` 是一个包含小说信息列表的网页地址，通过 `driver.get(url1)` 方法来加载这个网页并获取页面源代码，然后使用 `etree.HTML(data)` 将源代码转换成一个 XPath 可以解析的结构化数据，并使用 XPath 表达式 `/html/body/table/tbody/tr/td[1]/a/text()`、`/html/body/table/tbody/tr/td[2]/a/text()` 和 `/html/body/table/tbody/tr/td[3]/text()` 来提取作者名字、小说名字和小说类型，最后存储到变量中。其中 `novel_type_list.pop(0)` 操作是用来删除 XPath 提取结果中的第一个元素，因为它不是我们所需要的内容。

阅读全文

bd_name = html.xpath("//td[@width='30%']/text()").get() bd_name1 = html.xpath("//td[@class='bdmc']/following-sibling::*[1]/text()").get('')

相关推荐

ElemWhen.c分析：深入Linux/Unix编程中的xsl:when元素

Python库xpath_string-0.0.2.tar.gz的安装与应用

xpath_helper_2.0.2：提升XPath查询效率的工具

org.eclipse.e4.emf.xpath.nl_zh_4.20.0.v20210630020001.jar

Beginning.XSLT.and.XPath_Transforming.XML.Documents.and.Data源码

com.springsource.org.apache.xmlcommons-1.3.4_no_xpath.jar

demo_04_xpath_常见的用法.py

xpath_helper_2_0_2.rar

xpath_helper_2_0_2.zip

xpath_helper_2111_0_2.rar

xpath_helper_2.0.2_0.crx

xpath_helper_2.0.2.rar

dom4j-dom4j_1_6_1.tar.gz

xpath-helper_v1_v2.zip

Openfire_3_7_1.zip和jwchat-1.0.zip和xalan-j_2_7_0-bin.zip

lxml-5.0.2-cp39-cp39-manylinux_2_5_x86_64.manylinux1_x86_64.whl

谷歌Xpath插件2.0.2_0.crx.zip

xpath_helper-master.rar

Python库 | xpath_string-0.0.2.tar.gz

大家在看

以下为转载Plasma工作原理介紹-plasma等离子处理

Oracle ASCP Profiles (Chinese version)

arcgis标准分幅图制作与生产

《程序设计基础》历年试题及答案.pdf

RealTek2797用户手册，最新

最新推荐

036GraphTheory(图论) matlab代码.rar

HTML挑战：30天技术学习之旅

【CodeBlocks精通指南】：一步到位安装wxWidgets库（新手必备）

andorid studio 配置ERROR: Cause: unable to find valid certification path to requested target

VC++实现文件顺序读写操作的技巧与实践

【大数据时代必备：Hadoop框架深度解析】：掌握核心组件，开启数据科学之旅

opencv的demo程序

NeuronTransportIGA: 使用IGA进行神经元材料传输模拟

【Linux多系统管理大揭秘】：专家级技巧助你轻松驾驭

fofa和fofa viewer的区别