XML语言:DTD与Schema详解,定义数据的两种方式

需积分: 10 2 下载量 107 浏览量 更新于2024-08-16 收藏 182KB PPT 举报
(III) 定义文档内容 - XML语言介绍 XML (可扩展标记语言),由万维网联盟(W3C)创建,是一种用于表示和传输数据的轻量级标记语言。它的核心理念是为了解决HTML的局限性,尽管HTML在人机交互上表现出色,但其复杂性使得机器难以理解和解析文档的真正含义。XML的设计目标是提供一种更易于机器解析的标记语言。 定义XML文档的关键是通过两种方式:文档类型定义(DTD)和XML Schema。DTD是一种早期的规范,它定义了XML文档中允许的元素、元素的顺序、嵌套结构以及文档的整体结构,类似于SGML DTD,但更为简洁。DTD主要用于简单的情况,对于数据类型和更复杂的规则定义,W3C随后引入了XML Schema,它能提供更强大的模式定义能力,包括对数据类型的确切约束和验证规则。 举个例子,HTML文档中的邮政地址: ```html <p><b>Mrs. Mary McGoon</b><br>1401MainStreet<br>Anytown,NC34829</p> ``` 虽然直观易读,但对于机器来说,仅凭标记无法明确这是地址。而在XML中,我们可以添加特定含义的标记,如邮政编码: ```xml <person> <name>Mrs. Mary McGoon</name> <address> <street>Main Street</street> <city>Anytown</city> <postalCode>34829</postalCode> </address> </person> ``` 通过使用`<postalCode>`标签,XML不仅提供了清晰的结构,还明确了数据类型,使得机器能够准确识别并处理这些信息。XML Schema可以进一步细化这些标签的行为和数据类型限制,比如规定邮政编码必须是5位数字等。 XML语言定义文档内容时注重语义化和机器可读性,通过明确的标签系统和可扩展的模式定义,使得数据的存储、交换和处理更加高效和精确,是现代互联网应用中不可或缺的技术基础。