一 XML概念
1 解释
Extensible Markup Language(可扩展标记语言)。
创建自定义的标记语言。由W3C(万维网协会)创建,可用来克服HTML(Hypertext Markup Language超文本标记语言----所有网页信息的基础文本)的局限。
注:因为能在HTML文本中出现的元素都是已经规定好了的。
XML和HTML都是基于SGML(Standard Generalized Markup Language标准通用标记语言)的。
XML是自定义的扩展标记。主要是以数据为中心,用来标记数据,说明数据是什么。
2 应用领域
信息存储和交换
类似于数据管理系统,来存储数据。这种数据处理与硬件,软件没有太大的关系,就是一个文本文件,具有可移植性。处理XML数据的时候,通过JAVA代码写的解析器就可以存取XML数据
服务器配置文件
J2EE服务器用的比较多,在服务器端通过XML文件来进行处理数据业务。配置文件几乎全是XML文件。在EJB(Enterprise JavaBeans)、Hibernate、Struts、Spring、Webwork等JAVA热门技术领域,XML的应用更加重要
3 与 html的比较
相同点
都是基于文本的标记语言
不同点
功能:XML标识数据,说明数据是什么;HTML显示数据
内容:XML的标记都是自定义的,HTML的标记都是已经定义好的
示例
Html:
<p>
<b>张三</b>
<br>男
<br>北京广播学院:导播专业
</p>
XML:
<person>
<name>张三</name>
<sex>男</sex>
<university>北京广播学院</university>
<speciality>导播专业</speciality>
</person>
二 XML文档声明
大多数XML文档以XML声明作为开始,它向解析器提供了关于文档的基本信息。建议使用XML声明,但它不是必需的。如果有的话,那么它一定是文档的第一行代码。
如下所示:
<?xml version="" encoding=“UTF-8" standalone="no"?>
<?xml version="" encoding=“UTF-8" ?>
<?xml >声明最多包含三个属性(形式为:属性名=属性值)
version是使用的XML版本;
encoding是该文档所使用的字符集。如没有指定encoding,XML解析器会假定字符在utf-8字符集中,这是一个几乎支持世界上所有语言的字符和象形文字的unicode标准
standalone(可以是yes或no)定义了是否可以在不读取任何其它文件的情况下处理该文档。因为standalone=“no”是缺省值,所以我们很少会在XML声明中看到standalone
三定义XML文档
我们说XML就是自定义标记。XML的标记都是成对出现,有始有终。
XML文档由标记、元素、属性组成。
1 标记(标签):
由一对尖括号包起来。
例如:开始标记<自定义标记名>,结束标记</自定义标记名>
2 元素:
由成对的开始、结束标记以及两个标记中间的所有内容组成元素。
例如:
<name>张三</name>组成了一个元素,<sex>男</sex>也组成了一个元素,而<person>和</person>以及两个标记内的内容也组成了元素。
<person>元素内部还有四个元素,称为子元素
3 属性:
一个元素的开始标记中的名称-值对(形式为:属性名=属性值)
例如:<font color=“blue”>爱我中华</font>中,color就是font元素的属性。
XML文档的声明就包含了几个属性。
四元素
1 命名
1、名称只能以字母、下划线(_)、冒号(:)开头
2、名称中可以包含字母、数字、下划线以及其它在XML标准中允许的字符
3、名称中不能包含空格
4、名称中尽可能不要使用冒号(:),因为冒号在名称空间中被用于分隔名称空间和本地部分
2 元素的形式
空元素
< person />
带属性的空元素
< person age=’18’/>
带内容的元素
< person>< /person >
带内容和属性的元素
< person age=’18’>
<sex>男</sex>
< /person >
3 元素(子元素)内容的构成
前文描述:由成对的开始、结束标记以及两个标记中间的所有内容组成元素。
而两个标记中间的所有内容可以包含子元素、字
XML编程 重点讲义备忘 1 来自淘豆网m.daumloan.com转载请标明出处.