Josh的学习园地

本站首页    管理页面    写新日志    退出

首页(66) RSS(1) XML初学进阶(47) 


其实我是愿意学习的...
 
 ♀最新日志                                  ♀最新回复                                  
教你认识动态链接库DLL文件
cookie
网络小馅饼 Cookie
开始学习C#
考生了解公务员面试要把握“五个一”
语义Web的基础理论和关键技术研究
today
2006年的学习计划
语义Web和语义网格概述
专业学习
回复:RSS入门 : RSS初步接触
回复:XML(38)合并
回复:语义Web和语义网格概述
回复:全球电子商务的发展趋势及对我们的启
回复:语义Web的基础理论和关键技术研究
«Mar.2026»
1234567
891011121314
15161718192021
22232425262728
293031
 
 

[XML初学进阶]XML(24)
网上资源

3.1.1.1 将DTD引入“有效的”XML文件中    在上一章中,我们详细介绍了一个“形式良好的”XML文件应该满足哪些要求。“形式良好”是对XML文件的基本要求,它使得XML文件结构清晰、完整,便于处理程序对其进行解析,进一步可以简化处理程序的编写工作,并加快浏览的速度、减少浏览所需占用的内存空间。正所谓“没有规矩,不成方圆”。 然而,即便你已经可以保证写的XML文件是一个“形式良好的”XML文件了,它仍然未必能够体现XML的精髓。XML的精髓是什么呢?对,就是我们前面讲到的基于信息描述的、能够体现数据信息之间逻辑关系的、可以确保文件的易读性和易搜索性的自定义标记!从这一章中你将看到,使得你的XML文件遵循所谓“形式良好”要求的种种语法规则,这只是“万里长征走了第一步”。一个完全意义上的XML文件不仅应该是“形式良好的”,而且还应该是使用了这些自定义标记的“有效”的XML文件。 一个“有效的”文件首先应该是“形式良好”的。但这还远远不够,它还要往前更进一步。一个XML文件必须遵守文件类型描述DTD(Document Type Definition)中定义的种种规定。DTD实际上是“元标记”这个概念的产物,它描述了一个置标语言的语法和词汇表,也就是定义了文件的整体结构以及文件的语法。简而言之,DTD规定了一个语法分析器为了解释一个“有效的”XML文件所需要知道的所有规则的细节。 这个“规则”可以非常简单,仅仅列出所有有效的元素,例如元素、标记、属性、实体;也可以非常复杂,不但列出这些元素,还指出这些元素之间的内在联系,例如说明元素X元素中必须还包含元素Y或元素Z,但不能同时包含两个元素。 “我们前面强调了XML是大小写敏感的,这对于HTML的老手可能有点麻烦。例如,XML的处理指示 <?xml version="1.0" ... ?> 中所有单词必须都是小写的;可是所有DTD中的关键字都必须是大写的,例如ELEMENT、ATTLIST、#REQUIRED、#IMPLIED、NMTOKEN、ID等等。幸运的是,你自己的元素和属性的大小写可以由你任意指定,但一旦指定了,你必须从一而终,在整个文件中使用相同的大小写。例如,如果你给一个元素起名叫“BOOKS”,那么这个元素和“Books”并不相同。 ——Ken Sall” 一般习惯里,除非使用中文标记,否则我们或者全部都使用大写字母,或者象在VC中常用的那样,元素名字的第一个字母是大写,后面每个单词的第一个字母为大写,如BookList;属性字母的第一个字母为小写,但后面每个单词的第一个字母仍都采用大写,如listAuthor。请看下面例子: <!ELEMENT BookList (Book)+ ><!ATTLIST BookList        genre NMTOKEN #IMPLIED        listAuthor NMTOKEN #REQUIRED        lastUpdated NMTOKEN #REQUIRED > 讲到这里,不知各位读者是否已经能够区分“形式良好的”XML文件和“有效的”XML文件。如果大家对采用“有效的”XML文件的必要性还有所怀疑的话,让我们一起考虑一下下面这段中文: 棕色 扑向那只 一只 狐狸 动作敏捷的 狗 。懒惰的 正如你所见,所有的单词和标点都符合中文的词法,甚至说都是有明确语意的词汇,它们代表了“形式良好的”元素。但是,你明白我要表达的意思吗?在这种混乱的顺序之下,可能那些明确的单词和标点对你也失去了应有的意义。连人都难于理解一段“形式良好的”话,更不要说什么计算机了。 为了使这句话成为能读得懂的话,上面那些词汇的组织必须遵守中文句子的语法规定,譬如符合主、谓、宾的顺序,修饰语放在中心词之前等等。修改一下,上面的句子应该成为下面的形式: 一只动作敏捷的棕色狐狸扑向一只懒惰的狗。 好了,现在知道这句话想表达什么意思了吧? 在XML所描述的置标语言中,DTD便提供了语法规定,以便给各个语言要素赋予一定的顺序。为了说明特定的语法规则,DTD采用了一系列正则式,语法分析器将这些正则式与XML文件内部的数据模式相匹配,从而判别一个文件是否是有效的。匹配被严格执行,因此,如果XML文件中有任何信息不符合DTD的规定,都不会通过。 还记得我们曾说过XML脱胎于SGML文件吗?其实,一个“有效的”XML文件就是一个“形式良好的”SGML文件,也就是说,符合DTD中定义的语法是SGML文件的基本要求。从这个意义上说,XML把合法文件的范围扩大了,既包括“有效的”XML,也可包括“形式良好的”XML。 好了,相信大家现在已经明白什么叫DTD了。下面我们就开始详细学习XML中这个不可或缺、大显身手的部分。
xiaoqiao_xml 发表于 2005/12/27 14:10:44

阅读全文(864) | 回复(0) | 编辑 | 精华



发表评论:
昵称:
密码:
主页:
标题:
验证码:  (不区分大小写,请仔细填写,输错需重写评论内容!)
 
♀链接


♀留言板
签写新留言

HOHO
用户名称:
登陆密码:
密码保存:




站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.477 second(s), page refreshed 144818420 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号