XML简介及简单应用

XML 简介 可扩展标记型语言

html 里面的标签是固定的
XML 标签可以自己来定义<person></person><猫></猫>

XML用途

可以用于显示数据和存储数据(主要功能是存储)
XML 是w3c组织发布的技术
1.1版本不能向下兼容

XML应用

不同系统之间传输数据
QQ之间的数据传输
用了表示生活中有关系的数据
经常用在配置文件

XML的语法

xml的文档声明
定义元素(标签)
定义属性
注释
特殊字符
CDTAT区
PI指令 
XML中文乱码问题解决:保存和执行编码表需要一致


XML元素的定义

标签的定义 :标签有开始必须有结束
标签没有内容  可以在标签内结束
标签可以嵌套 必须合理嵌套:不能交叉
XML把空格换行都当成内容来解析
<aa>aaaaa</aa>
<aa>aaaaa
<aa/>这俩个不一样、
定义区分大小写  不能以数字和下划线开头
不能以xml XML等开头
不能包含空格 名称中间不能包含冒号

XML属性的定义

     属性定义的要求
一个标签上可以有多个属性
属性名称不能相同
属性值一定要用引号 
  其他和元素定义相同
注释不能嵌套

XML转义字符

&  --> &amp
<  --> &lt
>  --> &gt
"  --> &quot
'  --> &apos
XML的CDTAT区 解决频繁转义的操作
把需要转义内容放入CDTAT区就不需要转义
写法  <![CDTAT[ 内容 ]]>
PI指令(处理指令)
可以在xml中设置样式
写法:<?xml-stylesheet type="text/css" href="css路径">对中文不起作用

XML的约束

xml的约束技术 dtd约束 schema约束
dtd快速入门
    ·创建一个文件 后缀为.dtd
    ·步骤 看xml中有多少元素 有几个元素,写几个<!ELEMENT>
      判断元素书简单元素还是复杂元素 
简单元素就是没有子元素  <ELEMENT 元素名称(#PCDATA)>
复杂元素就是有子元素 <!ELEMENT 元素名称 (子元素)>
      在xml中引入dtd文件
<!DOCTYPE 根元素名称 SYSTEM "dtd文件路径">
     · 打开xml文件使用浏览器打开,浏览器只负责校验xml语法 不检验约束
     · 要检验xml约束,需要使用工具(myeclise)
       dta的三种引入方式
<!DOCTYPE 根元素名称 SYSTEM "dtd文件路径">
<!DOCTYPE 根元素名称 [ DTD代码 ]>
框架多使用<!DOCTYPE PUBLIC "dtd名称" "dtd文档url">
使用dtd定义元素
语法 <!ELEMENT 元素名称 约束>
简单元素#PCDATA 约束是字符串类型
EMPTY 元素为空
ANY:任意
复杂元素
<!ELEMENT 元素名称 (子元素)>子元素只能出现一次
+:表示一次或者多次
?:表示零次或者一次
*:表示任意次
子元素用|隔开  只能出现任意一个
使用dtd定义属性
语法: <! ATTLIST 元素名称 
属性名称 属性类型 属性的约束 > 
属性值类型  CDATA 文本字符串
   枚举 | 每次出现其中一个
   ID 表示属性取值不能重复


属性约束设置说明
REQUIRED:该属性必须出现
IMPLIED:该属性可有可无
FIXED:属性的取值为固定值
直接值:表示取值为该默认值
引入实体 定义<!ENTITY 实体名称 "实体的值">
使用 &实体名称
·注意 定义实体需要写在dtd里面
XML解析的简介(写到java代码)
xml的解析方式 :dom 和 sax
使用dom解析xml 优点方便操作增删改查 缺点是容易内存溢出
使用sam解析: 采用事件驱动 边读边解析  不会内存溢出 但不能实现增删改操作
         解析xml ,首先需要解析器
     不同的公司和组织 提供了api方式提供
   sun:针对dom 和sax的解析器 jaxp
   dom4j:                    dom4j(实际开发中使用最多)
   jdom:                     jdom
jaxp的api查看发现
jaxp是javase的一部分
jaxp解析器在jdk的javax.xml.parsers包里
四个类分别针对dom和sax解析使用的类
dom DocumentBuilder :解析器类 (抽象类)
可以从DocumentBuilderFactory.newDocumentBuilder()中获取
  一个解析xml的方法  parse(String url) 返回Document整个文档
- 返回的document是一个接口,父节点是Node,如果在document里面找不到想要的方法,到Node里面去找

- 在document里面方法 
getElementsByTagName(String tagname) 
-- 这个方法可以得到标签
-- 返回集合 NodeList
createElement(String tagName)
-- 创建标签
createTextNode(String data) 
-- 创建文本
appendChild(Node newChild) 
-- 把文本添加到标签下面
removeChild(Node oldChild) 
-- 删除节点
getParentNode() 
-- 获取父节点
NodeList list
- getLength() 得到集合的长度
- item(int index)下标取到具体的值
for(int i=0;i<list.getLength();i++) {
list.item(i)
}
getTextContent()
- 得到标签里面的内容
   DocumentBuilderFactory 解析器工厂(抽象类)
可以从newInstance()获取
sax SAXparser解析器类
   SAXparserFactory 解析器工厂
使用jaxp实现查询操作
*** 查询xml中所有的name元素的值
* 步骤
//查询所有name元素的值
/*
* 1、创建解析器工厂
DocumentBuilderFactory.newInstance();
* 2、根据解析器工厂创建解析器
builderFactory.newDocumentBuilder();
* 3、解析xml返回document
* Document document = builder.parse("src/person.xml");
* 4、得到所有的name元素
使用document.getElementsByTagName("name");
* 5、返回集合,遍历集合,得到每一个name元素
- 遍历 getLength() item()
- 得到元素里面值 使用 getTextContent()
* */


*** 查询xml中第一个name元素的值
* 步骤
/*
* 1、创建解析器工厂
* 2、根据解析器工厂创建解析器
* 3、解析xml,返回document

* 4、得到所有name元素
* 5、使用返回集合,里面方法 item,下标获取具体的元素
NodeList.item(下标): 集合下标从0开始
* 6、得到具体的值,使用 getTextContent方法

* */


使用jaxp添加节点
*** 在第一个p1下面(末尾)添加 <sex>nv</sex>
**步骤
/*
* 1、创建解析器工厂
* 2、根据解析器工厂创建解析器
* 3、解析xml,返回document

* 4、得到第一个p1
* - 得到所有p1,使用item方法下标得到


* 5、创建sex标签 createElement
* 6、创建文本 createTextNode
* 7、把文本添加到sex下面 appendChild


* 8、把sex添加到第一个p1下面 appendChild

* 9、回写xml
* */


使用jaxp修改节点
*** 修改第一个p1下面的sex内容是nan
** 步骤
/*
* 1、创建解析器工厂
* 2、根据解析器工厂创建解析器
* 3、解析xml,返回document 

* 4、得到sex item方法
* 5、修改sex里面的值  
*** setTextContent方法

* 6、回写xml
* */


使用jaxp删除节点
*** 删除<sex>nan</sex>节点
** 步骤
/*
* 1、创建解析器工厂
* 2、根据解析器工厂创建解析器
* 3、解析xml,返回document 

* 4、获取sex元素
* 5、获取sex的父节点  使用getParentNode方法
* 6、删除使用父节点删除  removeChild方法

* 7、回写xml
* */


使用jaxp遍历节点
** 把xml中的所有元素名称打印出来
** 步骤
/*
* 1、创建解析器工厂
* 2、根据解析器工厂创建解析器
* 3、解析xml,返回document

* ====使用递归实现=====
* 4、得到根节点
* 5、得到根节点子节点
* 6、得到根节点子节点的子节点
* */
** 遍历的方法
//递归遍历的方法
private static void list1(Node node) {
//判断是元素类型时候才打印
if(node.getNodeType() == Node.ELEMENT_NODE) {
System.out.println(node.getNodeName());
}

//得到一层子节点
NodeList list = node.getChildNodes();
//遍历list
for(int i=0;i<list.getLength();i++) {
//得到每一个节点
Node node1 = list.item(i);
//继续得到node1的子节点
//node1.getChildNodes()
list1(node1);
}
}


schema约束

dtd语法: <!ELEMENT 元素名称 约束>
** schema符合xml的语法,xml语句
** 一个xml中可以有多个schema,多个schema使用名称空间区分(类似于java包名)
** dtd里面有PCDATA类型,但是在schema里面可以支持更多的数据类型
*** 比如 年龄 只能是整数,在schema可以直接定义一个整数类型
*** schema语法更加复杂,schema目前不能替代dtd


schema的快速入门
* 创建一个schema文件 后缀名是 .xsd
** 根节点 <schema>
** 在schema文件里面
** 属性  xmlns="http://www.w3.org/2001/XMLSchema"
- 表示当前xml文件是一个约束文件
** targetNamespace="http://www.itcast.cn/20151111"
- 使用schema约束文件,直接通过这个地址引入约束文件
** elementFormDefault="qualified"
步骤
(1)看xml中有多少个元素
<element>
(2)看简单元素和复杂元素
* 如果复杂元素
	<complexType>
					<sequence>
						子元素
					</sequence>
			</complexType>


(3)简单元素,写在复杂元素的
<element name="person">
			<complexType>
			<sequence>
					<element name="name" type="string"></element>
					<element name="age" type="int"></element>
			</sequence>
			</complexType>
			</element>
(4)在被约束文件里面引入约束文件
<person xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xmlns="http://www.itcast.cn/20151111"
xsi:schemaLocation="http://www.itcast.cn/20151111 1.xsd">


** xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
-- 表示xml是一个被约束文件
** xmlns="http://www.itcast.cn/20151111"
-- 是约束文档里面 targetNamespace
** xsi:schemaLocation="http://www.itcast.cn/20151111 1.xsd">
-- targetNamespace 空格  约束文档的地址路径



* <sequence>:表示元素的出现的顺序
<all>: 元素只能出现一次
<choice>:元素只能出现其中的一个
maxOccurs="unbounded": 表示元素的出现的次数
<any></any>:表示任意元素


* 可以约束属性
* 写在复杂元素里面
***写在 </complexType>之前
--
<attribute name="id1" type="int" use="required"></attribute>
- name: 属性名称
- type:属性类型 int stirng
- use:属性是否必须出现 required


* 复杂的schema约束
		<company xmlns = "http://www.example.org/company"
	xmlns:dept="http://www.example.org/department"
	xmlns:xsi = "http://www.w3.org/2001/XMLSchema-instance"
	xsi:schemaLocation="http://www.example.org/company company.xsd http://www.example.org/department department.xsd" >
* 引入多个schema文件,可以给每个起一个别名


<employee age="30">
<!-- 部门名称 --> 
<dept:name>100</dept:name>
* 想要引入部门的约束文件里面的name,使用部门的别名 detp:元素名称
<!-- 员工名称 -->
<name>王晓晓</name>   
</employee>


sax解析的原理(********)

* 解析xml有两种技术 dom 和sax


* 根据xml的层级结构在内存中分配一个树形结构
** 把xml中标签,属性,文本封装成对象


* sax方式:事件驱动,边读边解析
* 在javax.xml.parsers包里面
** SAXParser
此类的实例可以从 SAXParserFactory.newSAXParser() 方法获得
- parse(File f, DefaultHandler dh) 
* 两个参数
** 第一个参数:xml的路径
** 事件处理器


** SAXParserFactory
实例 newInstance() 方法得到
* 画图分析一下sax执行过程
* 当解析到开始标签时候,自动执行startElement方法
* 当解析到文本时候,自动执行characters方法
* 当解析到结束标签时候,自动执行endElement方法

使用jaxp的sax方式解析xml(**会写***)

* sax方式不能实现增删改操作,只能做查询操作
** 打印出整个文档
*** 执行parse方法,第一个参数xml路径,第二个参数是 事件处理器
*** 创建一个类,继承事件处理器的类,
***重写里面的三个方法

* 获取到所有的name元素的值
** 定义一个成员变量 flag= false
** 判断开始方法是否是name元素,如果是name元素,把flag值设置成true
** 如果flag值是true,在characters方法里面打印内容
** 当执行到结束方法时候,把flag值设置成false


* 获取第一个name元素的值
** 定义一个成员变量 idx=1
** 在结束方法时候,idx+1 idx++
** 想要打印出第一个name元素的值,
- 在characters方法里面判断,
-- 判断flag=true 并且 idx==1,在打印内容
使用dom4j解析xml
* dom4j,是一个组织,针对xml解析,提供解析器 dom4j


* dom4j不是javase的一部分,想要使用第一步需要怎么做?
*** 导入dom4j提供jar包
-- 创建一个文件夹 lib
-- 复制jar包到lib下面,
-- 右键点击jar包,build path -- add to build path
-- 看到jar包,变成奶瓶样子,表示导入成功

* 得到document
SAXReader reader = new SAXReader();
        Document document = reader.read(url);
* document的父接口是Node
* 如果在document里面找不到想要的方法,到Node里面去找


* document里面的方法 getRootElement() :获取根节点 返回的是Element


* Element也是一个接口,父接口是Node
- Element和Node里面方法
** getParent():获取父节点
** addElement:添加标签


* element(qname)
** 表示获取标签下面的第一个子标签
** qname:标签的名称
* elements(qname)
** 获取标签下面是这个名称的所有子标签(一层)
** qname:标签名称
* elements()
** 获取标
使用dom4j查询xml
* 解析是从上到下解析
* 查询所有name元素里面的值
/*
1、创建解析器
2、得到document
3、得到根节点  getRootElement() 返回Element


4、得到所有的p1标签
* elements("p1") 返回list集合
* 遍历list得到每一个p1
5、得到name
* 在p1下面执行 element("name")方法 返回Element
6、得到name里面的值
* getText方法得到值
*/

* 查询第一个name元素的值
/*
* 1、创建解析器
* 2、得到document
* 3、得到根节点

* 4、得到第一个p1元素  
** element("p1")方法 返回Element
* 5、得到p1下面的name元素
** element("name")方法 返回Element
* 6、得到name元素里面的值
** getText方法
* */
* 获取第二个name元素的值
/*
* 1、创建解析器
* 2、得到document
* 3、得到根节点

*  4、得到所有的p1 
** 返回 list集合
*  5、遍历得到第二个p1
** 使用list下标得到 get方法,集合的下标从 0 开始,想要得到第二个值,下标写 1 
*  6、得到第二个p1下面的name
** element("name")方法 返回Element
*  7、得到name的值
** getText方法
* */
使用dom4j查询xml
* 解析是从上到下解析
* 查询所有name元素里面的值
/*
1、创建解析器
2、得到document
3、得到根节点  getRootElement() 返回Element


4、得到所有的p1标签
* elements("p1") 返回list集合
* 遍历list得到每一个p1
5、得到name
* 在p1下面执行 element("name")方法 返回Element
6、得到name里面的值
* getText方法得到值
*/

* 查询第一个name元素的值
/*
* 1、创建解析器
* 2、得到document
* 3、得到根节点

* 4、得到第一个p1元素  
** element("p1")方法 返回Element
* 5、得到p1下面的name元素
** element("name")方法 返回Element
* 6、得到name元素里面的值
** getText方法
* */
* 获取第二个name元素的值
/*
* 1、创建解析器
* 2、得到document
* 3、得到根节点

*  4、得到所有的p1 
** 返回 list集合
*  5、遍历得到第二个p1
** 使用list下标得到 get方法,集合的下标从 0 开始,想要得到第二个值,下标写 1 
*  6、得到第二个p1下面的name
** element("name")方法 返回Element
*  7、得到name的值
** getText方法
* */

7、使用dom4j实现添加操作
* 在第一个p1标签末尾添加一个元素 <sex>nv</sex>
* 步骤
/*
* 1、创建解析器
* 2、得到document
* 3、得到根节点

* 4、获取到第一个p1
* 使用element方法
* 5、在p1下面添加元素
* 在p1上面直接使用 addElement("标签名称")方法 返回一个Element


* 6、在添加完成之后的元素下面添加文本
* 在sex上直接使用 setText("文本内容")方法
* 7、回写xml
* 格式化 OutputFormat,使用 createPrettyPrint方法,表示一个漂亮的格式
* 使用类XMLWriter 直接new 这个类 ,传递两个参数
*** 第一个参数是xml文件路径 new FileOutputStream("路径")
*** 第二个参数是格式化类的值
* */


使用dom4j实现在特定位置添加元素 
* 在第一个p1下面的age标签之前添加 <school>ecit.edu.cn</schlool>
* 步骤
   /*
* 1、创建解析器
* 2、得到document
* 3、得到根节点
* 4、获取到第一个p1

* 5、获取p1下面的所有的元素
* ** elements()方法 返回 list集合


*      ** 使用list里面的方法,在特定位置添加元素
* ** 首先创建元素 在元素下面创建文本
- 使用DocumentHelper类方法createElement创建标签
- 把文本添加到标签下面 使用 setText("文本内容")方法


*       *** list集合里面的 add(int index, E element)
*       - 第一个参数是 位置 下标,从0开始
*       - 第二个参数是 要添加的元素
* 6、回写xml
* */


** 可以对得到document的操作和 回写xml的操作,封装成方法
** 也可以把传递的文件路径,封装成一个常量
*** 好处:可以提高开发速度,可以提交代码可维护性
- 比如想要修改文件路径(名称),这个时候只需要修改常量的值就可以了,其他代码不需要做任何改变
使用dom4j实现修改节点的操作
* 修改第一个p1下面的age元素的值 <age>30</age>
* 步骤
/*
* 1、得到document
* 2、得到根节点,然后再得到第一个p1元素
* 3、得到第一个p1下面的age
element("")方法
* 4、修改值是 30
* * 使用setText("文本内容")方法
* 5、回写xml

* */


使用dom4j实现删除节点的操作
* 删除第一个p1下面的<school>ecit</school>元素
* 步骤
/*
* 1、得到document
* 2、得到根节点
* 3、得到第一个p1标签
* 4、得到第一个p1下面的school元素


* 5、删除(使用p1删除school)
* * 得到school的父节点
- 第一种直接得到p1
- 使用方法 getParent方法得到
* 删除操作
- 在p1上面执行remove方法删除节点
* 6、回写xml
* */


使用dom4j获取属性的操作
* 获取第一个p1里面的属性id1的值
* 步骤
/*
* 1、得到document
* 2、得到根节点
* 3、得到第一个p1元素
* 4、得到p1里面的属性值
- p1.attributeValue("id1");
- 在p1上面执行这个方法,里面的参数是属性名称

使用dom4j支持xpath的操作
* 可以直接获取到某个元素 


* 第一种形式
/AAA/DDD/BBB: 表示一层一层的,AAA下面 DDD下面的BBB
* 第二种形式
//BBB: 表示和这个名称相同,表示只要名称是BBB,都得到
* 第三种形式
/*: 所有元素
* 第四种形式
** BBB[1]: 表示第一个BBB元素
×× BBB[last()]:表示最后一个BBB元素
* 第五种形式
** //BBB[@id]: 表示只要BBB元素上面有id属性,都得到
* 第六种形式
** //BBB[@id='b1'] 表示元素名称是BBB,在BBB上面有id属性,并且id的属性值是b1


使用dom4j支持xpath具体操作
** 默认的情况下,dom4j不支持xpath
** 如果想要在dom4j里面是有xpath
* 第一步需要,引入支持xpath的jar包,使用 jaxen-1.1-beta-6.jar
** 需要把jar包导入到项目中


** 在dom4j里面提供了两个方法,用来支持xpath
*** selectNodes("xpath表达式")
- 获取多个节点
*** selectSingleNode("xpath表达式")
- 获取一个节点


** 使用xpath实现:查询xml中所有name元素的值
** 所有name元素的xpath表示: //name
** 使用selectNodes("//name");
** 代码和步骤
/*
* 1、得到document
* 2、直接使用selectNodes("//name")方法得到所有的name元素

* */
//得到document
Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);
//使用selectNodes("//name")方法得到所有的name元素
List<Node> list = document.selectNodes("//name");
//遍历list集合
for (Node node : list) {
//node是每一个name元素
//得到name元素里面的值
String s = node.getText();
System.out.println(s);
}

** 使用xpath实现:获取第一个p1下面的name的值
* //p1[@id1='aaaa']/name
* 使用到 selectSingleNode("//p1[@id1='aaaa']/name")
* 步骤和代码
/*
* 1、得到document
* 2、直接使用selectSingleNode方法实现
* - xpath : //p1[@id1='aaaa']/name
* */
//得到document
Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);
//直接使用selectSingleNode方法实现
Node name1 = document.selectSingleNode("//p1[@id1='aaaa']/name"); //name的元素
//得到name里面的值
String s1 = name1.getText();
System.out.println(s1);

猜你喜欢

转载自blog.csdn.net/zhww1996/article/details/80802414