第12章 XML技术
本章的重要概念
(1)从SGML、HTML到XML的发展,XML文档、DTD(文档类型定义)、XML模式,XML数据库的存取方法。
(2)XML查询语言XQUERY的基本功能、基本概念,简单查询的表达,各种类型查询的表达,复杂查询的表达。
(3)基于关系数据库XML的处理,XML存储和查询系统体系结构,XML数据到关系数据库的存储映射,基于关数据库的XML查询。
本章概述
随着因特网的快速发展,XML(可扩展标记语言,eXtensible Markup Language)上的一种数据发布语言出现,同时作为数据交换语言,正应用于其它很多领域如数据交换、标准定一等。同时XML数据的各种存储与查询的技术也日益成熟,在XML查询语言、XML数据的存储方法、查询代数、查询优化和索引技术方面等方面出现很多研究成果和成熟方法,绝大多数数据库管理系统厂商均在它们的产品中增加了对XML数据处理的模块,同时也出现了专门针对XML数据的存储系统,并应用在很多实际系统中。
主要内容
XML概述
常用的XML查询语言:XQUERY
基于关系数据库的XML处理
XML概述
从SGML、HTML到XML
XML是SGML的一个子集,它试图将HTML的简单性与SGML的强大功能结合起来。XML的设计目的明确地定位为万维网上的应用。设计工作基于两个重要的准则:易于编写处理XML的计算机程序,以及人和系统能花费极少的代价将HTML移植到XML中。
1996年W3C正式成立XML工作组。1998年2月,。其特点为:
l XML可直接在因特网上使用
l XML应支持广泛的应用
l 使用方便,结构简明
l 表达能力强,适于计算机进行处理
XML、DTD与XML Schema
一个XML文档由序言和文档实例两个部分组成。序言包括一个XML声明和一个文档类型声明,二者都是可选的。文档类型声明由DTD定义,它定义了文档类型结构。序言之后是文档实例,它是文档的主体,它是DTD的一个实现。
XML文档中最重要的组件是元素(element)。每个元素都有一个类型,类型声明可以放在文档内部或放在外部DTD文件中。元素可能具有一组属性(称为属性列表),每个属性说明有属性名和属性值类型。在文档中,用开始标记<标签>和结束标记</>来确定元素的边界。元素之间的包含关系是一种树型结构。一个XML文档就是一棵有根、有序、带标记的树。
一个XML文档
<?xml version="" encoding="ISO-8859-1"?>
<!DOCTYPE book system "/DTDS/">
<book year =”1998”>
<title>XML技术内幕</title>
<author>
<firstname>Natanya</firstname>
<lastname>Pitts</lastname>
</author>
<price> $25</price>
</book>
一个XML文档
:
<!ELEMENT book (title,author*,price)>
<!ARRLIST BOOK year CDATA #REQUIRED>
<!ELEMENT title (#PCDATA)>
<!ELEMENT author (firstname,lastname)>
<!ELEMENT firstname (#PCDATA)>
<!ELEMENT lastname (#PCDATA)>
<!ELEMENT price (#PCDATA)>
XML数据库
纯粹的XML存取方法:它是专门针对XML格式文档进行存取管理和数据操作的数据库,数据库中的数据和元数据完全采用XML结构表示,其底层针对XML数据的特点,采用相应的存储结构,而不是采用现有的数据存储工具。
基于关系数据库的存取方法:它是在关系数据库基础之上扩展了XML支持模块,它将XML数据存储在关系数据库中,在查询时将XML数据查询语言转换成关系数据数据库查询语言。
返回
常用的XML查询语言:XQUERY
查询每本书的作者人数以及每位作者的名字,语句为:
<results>
{
FOR $book IN //book //指定变量$book的取值范围是结点<book>
LET $authors := $book/author
//把变量$authors赋值为$book的子结点<author>
RETURN
<book authorCount={
第12章+XML技术 来自淘豆网m.daumloan.com转载请标明出处.