XPath语法格式总结是一篇详细介绍XPath语言的实用指南,旨在帮助读者更好地理解和掌握XPath在XML文档节点树中的定位功能。本文分为以下几个部分进行讲解: 1. XPath简介: XPath是W3C制定的标准,主要用于在XML文档中查找、定位和选择节点,它有两个主要版本:XPath1.0于1999年发布,是基础版;XPath2.0则在2007年更新,增加了更多功能,保持了对XPath1.0的向下兼容,并作为XSLT2.0和XQuery1.0的核心查询语言。 2. XPath路径表达式详解: - 路径表达式语法:XPath使用特定的语法结构来指定从文档根节点到所需节点的路径,包括绝对路径(从根节点开始)和相对路径(相对于当前节点)。 - 表达式上下文:XPath表达式的执行依赖于当前上下文节点,即查询起点。 - 谓词和轴:谓词用于筛选满足条件的节点,轴则定义了节点之间的关系,如child、descendant等。 - 运算符和特殊字符:XPath支持多种运算符,如等于、大于、小于等,以及特殊字符如双斜线(/)和点号(.)用于路径分隔。 3. 常用表达式实例与函数: 文章提供了具体的XML文件作为示例,通过解析这个文件,展示了如何使用XPath表达式来访问不同的元素和属性,如选取所有书籍的作者、查找特定章节等。同时,还涉及到了XPath中的内置函数,如text()、@attr(获取属性值)等。 4. 元素、属性、原子值等基础知识: 在学习XPath前,读者需要具备XML的基本概念,如节点、元素、属性、文本、处理指令、注释、根节点、命名空间,以及节点间的父子、兄弟、祖先和后代等关系。 通过阅读这篇文章,读者不仅能系统地学习XPath的语法和应用场景,还能通过实例加深理解,提高在实际工作中的应用效率。如果你在学习过程中遇到疑问或想要深入了解,可以参考W3C官方文档或在文章末尾提供的链接。
下载后可阅读完整内容,剩余5页未读,立即下载
# 目标网站:www.hongniuziyuan.com # 爬取下来的数据格式 # 保存到记事本中 # 电影名字|导演|演员|评分|所属地区|播放地址 # 变形金刚|小斯蒂芬·卡普尔|安东尼·拉莫斯,多米尼克·菲什巴克,彼特·库伦,朗·普尔曼,彼特·丁拉|0.0|美国|https://hnzy.bfvvs.com/play/YervnY4e import requests from lxml import etree response = requests.get("https://www.hongniuziyuan.com/") html = response.content.decode() # 将二进制数据转换为文本数据 # response.text 文本数据 # print(html) # 将我们字符串转换为一个dom树 dom = etree.HTML(html) # 目的就是为了使用xpath语法去寻找我们的想要的标签 # xpath语法 # xs = dom.xpath('/html/body/div[3]/div[3]/ul/div/li/div/a/img') xs = dom.xpath('/html/body/div[4]/ul[2]/li/strong/span[1]/a') #元素:妖神记 第五季 [第328集完结] #xpath:/html/body/div[4]/ul[2]/li/strong/span[1]/a for s in xs:
- 粉丝: 4
- 资源: 931
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- C++多态实现机制详解:虚函数与早期绑定
- Java多线程与异常处理详解
- 校园导游系统:无向图实现最短路径探索
- SQL2005彻底删除指南:避免重装失败
- GTD时间管理法:提升效率与组织生活的关键
- Python进制转换全攻略:从10进制到16进制
- 商丘物流业区位优势探究:发展战略与机遇
- C语言实训:简单计算器程序设计
- Oracle SQL命令大全:用户管理、权限操作与查询
- Struts2配置详解与示例
- C#编程规范与最佳实践
- C语言面试常见问题解析
- 超声波测距技术详解:电路与程序设计
- 反激开关电源设计:UC3844与TL431优化稳压
- Cisco路由器配置全攻略
- SQLServer 2005 CTE递归教程:创建员工层级结构