XML简易教程之三-巨人网络通讯

XML简易教程之三

XML的未来
现在你已经知道XML。确实，结构有点复杂，而且DTD有各种可
以定义文档可以包含的内容的选项。但还不只这些。

考虑一个数据交换对其很重要的产业，如银行。银行使用所有
权系统来跟踪内部的交易，但是如果他们在Web上使用一种通用
的XML格式，那么他们必须描述交易信息给另一个机构或应用程
序（如Quicken或MS Money）。当然，他们也可以在Web页面上
表示数据。FYI：这个标记不存在。它叫做OFEX，开放金融交易
格式（Open Financial Exchange）。

在某种情况下，如果PC上的IE 4碰到一个SOFTPKG> 标记符，一
个函数会被启动以给用户更新已安装的软件的机会。如果你用
的是Windows 98，你可能看见过这种情况，但是不知道它是一
个XML应用程序。

这里我们有三个XML应用程序，看起来与Andy Grove在70年代看
到的加法机、打字机和铅笔不同。但是与最终出现在PC上的应
用程序相似，XML的好处可以被一般性地描述为：“当你使用人
类和机器可读的标记符描述你的数据时，会有好事发生的。”

这些好事是什么呢？我不知道。但是我也不知道我的PC上的下
一代程序将会是什么样。只要数据以这种方式标记，可以产生
不同的应用。

你开始考虑它会扩展到什么程度了吗？

我们有很多XML的实际应用可以谈论，我会在不久的将来谈到它
们的。既然我们都是网民，以后将是XSL（扩展样式语言 -
eXtensible Style Language）了。

顺便提一句，这个菜谱确实是我妈妈_的，而且很杰出。如果你
用之，再加半杯碎椰子。

我写这篇文章是因为我真诚地关心你对我的看法。我担心的是：如果你读过我写的XML简介然后准备开始写自己的XML文档。于是你开始寻找一个已经建立的DTD来表示你的信息。你找到一个，如下所示：

!ATTLIST fn

%attr.lang;

value CDATA #FIXED "TEXT">

!ENTITY % attr.img "

img.type CDATA #REQUIRED

img.data ENTITY #REQUIRED">

马上你就会认为Jay一定是一个白痴。他没有说关于ATTLIST和ENTITY的任何事 - 不管它们是什么。

那么让我们谈谈这件事，先有一点耐心。

上面这些行可能不好看，但实际上没什么。它们被用在DTD中来定义XML文档中的属性和实体。了解HTML的人会对这很清楚。属性是带有HTML标记符的条目，用来更准确地描述标记符。在经常出现的img src="my.gif" height="20" width="20">中，有两个属性：height和width。你在后面会看到，在XML文档使用属性与之很相似。

对实体也没有什么新东西。如果你用过，你就已经掌握了最基本的东西。一个被和分号包围起来的字符串用来表示另一个或一套字符。（这里有ISO实体的完整清单。）

当然，XML中属性和实体还有其它功能。这就不可避免地要引入语法，虽然不太多。一旦知道了这些，就会不费劲地使用XML文档。

简化菜谱

如果你读过我写的XML简介，你会记得用简单的标记符表示的菜谱中的组成成分，如item>2 cups flour/item>。在写完那篇文章后，我在网上漫游，发现关于菜谱的另一个XML文档。其中的菜谱元素如下所示：

ingredient quantity="2" units="cups">flour/ingredient>

这种方法有一个实际的好处：可以更容易控制数据。用第一种方法，item>标记符用来容纳一堆不同的信息。如果我想提取组成成分的清单而不需要各成分的量，我就不会那么做。

我可以用如下的结构取得相似的功能：

item>flour

quantity>2/quantity>

units>cups/units>

这可以被处理，但是有两个问题：首先，item元素包含了混合的内容：文本和其它标记符。我很快就发现应该尽量避免这种结构。其次是标记符几乎没有独立的意义。很难想象只要units而不要实际的组成成分的情况。这些条目可以被简单描述，我宁愿把它们当作属性。

首先要注意的是属性名，quantity和units只有被能够翻译它们的应用程序处理时才有意义。