XML学习笔记:基础与实战

5星 · 超过95%的资源 需积分: 3 2 下载量 62 浏览量 更新于2024-09-13 收藏 5KB TXT 举报
"这是一份XML的学习笔记,适合Java初学者参考。笔记涵盖了XML的基本概念、DTD Schema的介绍、XML与Java API的交互以及XPath的简单应用。还提供了HTML和XML的对比,以及一个简单的HTML页面和XML文档的示例。" 在信息技术领域,XML(eXtensible Markup Language)是一种用于标记数据的语言,它允许我们以结构化的方式存储和传输信息。XML的设计目标是传输和存储数据,而不是显示数据,与HTML(HypeText Markup Language)不同,HTML主要用于网页的展示。 XML的结构基于元素,每个XML文档都由一系列的元素构成。这些元素可以嵌套,形成层次结构。例如,在提供的XML文档`book.xml`中,`books`元素包含了多个`book`元素,每个`book`元素又包含`title`、`price`、`author`和`introduce`子元素。XML文档的开头通常会有一个声明,如`<?xml version="1.0" encoding="utf-8"?>`,指定文档使用的XML版本和字符编码。 DTD(Document Type Definition)Schema是定义XML文档结构的一种方式,它规定了文档中可以出现的元素类型、属性及它们之间的关系。例如,可以创建一个DTD来定义`book`元素必须包含`title`、`price`和`author`,并且可以有可选的`introduce`元素。 Java API提供了处理XML文档的工具,如DOM(Document Object Model)和SAX(Simple API for XML),它们分别以树形结构和事件驱动的方式解析XML。开发者可以使用这些API读取、修改或创建XML文档。 XPath是一种在XML文档中查找信息的语言,它可以选取节点(如元素、属性、文本等),也可以通过路径表达式进行定位。在示例中,XPath可以用来找到所有书籍的标题,如:`/books/book/title`。 在HTML与XML的对比中,HTML主要用于展示网页内容,而XML更注重数据的结构和语义。HTML使用预定义的标签,如`<table>`、`<tr>`、`<td>`,而XML允许自定义标签,如`<book>`、`<title>`等。 在编写XML时,应注意以下规范: 1. 文档必须有且仅有一个根元素。 2. 元素名和属性名是大小写敏感的。 3. 元素内容不能包含未经转义的特殊字符,如`<`需要转义为`&lt;`。 4. XML文档可以包含注释,如`<!-- don't be shy just try -->`。 这个XML笔记对于初学者来说是一个很好的起点,可以帮助理解XML的基础知识和实际应用。通过学习和实践,你可以掌握如何创建、解析和操作XML文档,从而在各种IT项目中有效利用XML来处理和交换数据。