XML指南——XML 属性
跟HTML一样,XML元素再开始标记处可以由元素属性。
属性通常包含一些关于元素的额外信息。
XML属性
XML元素可以拥有属性。
你一定还记得这样的HTML代码吧: IMG SRC="computer.gif">。src是img元素的属性,提供了关于img元素的额外信息。
在HTML中 (在XML中也一样)元素的属性提供了元素的额外信息。
img src="computer.gif">
a href="demo.asp">
书信提供的信息通常不是数据的一部分。在下面的例子中,类型和数据毫不相关,但对于操作这个元素的软件来说却相当重要。
file type="gif">computer.gif/file>
引用风格"female" 还是 'female'?
属性值必须用引号引着。单引号、双引号都可以使用。例如一个人的性别,person元素可以这样写:
person sex="female">
也可以这样写:
person sex='female'>
上面的两种写法在一般情况下是没有区别的,使用双引号的应用更普遍一些。但是在某些特殊的情况下就必须使用单引号,比如下面的例子:
gangster name='George "Shotgun" Ziegler'>
使用子元素还是使用属性
数据既可以存储在子元素中也可以存储在属性中。
请看下面的例子:
person sex="female">
firstname>Anna/firstname>
lastname>Smith/lastname>
/person>
person>
sex>female/sex>
firstname>Anna/firstname>
lastname>Smith/lastname>
/person>
在第一个例子中,sex是一个属性,在第二个例子中,sex则是一个子元素。这两个例子都提供了相同的信息。
什么时候用属性,什么时候用子元素没有一个现成的规则可以遵循。我的经验是属性在HTML中可能相当便利,但在XML中,你最好避免使用。
我喜欢的风格
我更愿意把数据存储到子元素中。
下面的三个XML文档包含了相同的信息:
第一个例子使用了data属性:
note date="12/11/99">
to>Tove/to>
from>Jani/from>
heading>Reminder/heading>
body>Don't forget me this weekend!/body>
/note>
第二个例子使用了data元素:
note>
date>12/11/99/date>
to>Tove/to>
from>Jani/from>
heading>Reminder/heading>
body>Don't forget me this weekend!/body>
/note>
第三个例子使用了扩展的data元素: (这就是我推荐的样式):
note>
date>
day>12/day>
month>11/month>
year>99/year>
/date>
to>Tove/to>
from>Jani/from>
heading>Reminder/heading>
body>Don't forget me this weekend!/body>
/note>
避免使用属性?
应该避免使用属性么?
这里有一些使用属性引发的问题:
属性不能包含多个值(子元素可以)。
属性不容易扩展。
属性不能够描述结构(子元素可以)。
属性很难被程序代码处理。
属性值很难通过DTD进行测试。
如果使用属性来存储数据,那么所编写的XML文档一定很难阅读和操作。尽量使用元素来描述数据,仅使用属性来描述那些与数据关系不大的额外信息。
不要象下面的例子那样(如果你那么做了说明你还没有明白上面的观点)。
note day="12" month="11" year="99"
to="Tove" from="Jani" heading="Reminder"
body="Don't forget me this weekend!">
/note>
属性规则的例外
规则总是有例外的。
我的关于属性的规则也有一个例外:
有些时候应该为一个元素设计一个ID引用,通过这个ID可以引用存取特定的XML元素,就象HTML中的name和id属性一样。请看下面的例子:
messages>
note ID="501">
to>Tove/to>
from>Jani/from>
heading>Reminder/heading>
body>Don't forget me this weekend!/body>
/note>
note ID="502">
to>Jani/to>
from>Tove/from>
heading>Re: Reminder/heading>
body>I will not!/body>
/note>
/messages>
在上面的例子中,ID属性就相当于一个计数器,或者是一个唯一的标识符,在XML文档中标识不同的便条信息,他不是便条信息的一部分。
我们所要尽力向读者说明的是:元数据(与数据有关的数据)应该以属性的方式存储,而数据本身应该以元素的形式存储。