javaweb学习第六天：xml重点知识点总结

1.思维导图：

2、xml的简介（了解）
* eXtensible Markup Language：可扩展标记型语言
** 标记型语言：html是标记型语言
- 也是使用标签来操作
** 可扩展：
- html里面的标签是固定，每个标签都有特定的含义 <h1> <hr/>
- 标签可以自己定义,可以写中文的标签 <person></person、<猫></猫>

* xml用途
** html是用于显示数据，xml也可以显示数据（不是主要功能）
** xml主要功能，为了存储数据

* xml是w3c组织发布的技术

* xml有两个版本 1.0 1.1
- 使用都是1.0版本，（1.1版本不能向下兼容）

3、xml的应用
* 不同的系统之间传输数据
** qq之间数据的传输
** 画图分析过程

* 用来表示生活中有关系的数据

* 经常用在文件配置
* 比如现在连接数据库肯定知道数据库的用户名和密码，数据名称
* 如果修改数据库的信息，不需要修改源代码，只要修改配置文件就可以了

4、xml的语法
（1）xml的文档声明（***）
* 创建一个文件后缀名是 .xml
* 如果写xml，第一步必须要有一个文档声明（写了文档声明之后，表示写xml文件的内容）
** <?xml version="1.0" encoding="gbk"?>
*** 文档声明必须写在第一行第一列

* 属性
- version：xml的版本 1.0(使用) 1.1
- encoding：xml编码 gbk utf-8 iso8859-1(不包含中文)
- standalone：是否需要依赖其他文件 yes/no

* xml的中文乱码问题解决
** 画图分析乱码问题
** 保存时候的编码和设置打开时候的编码一致，不会出现乱码

（2）定义元素（标签）（***）
（3）定义属性（***）
（4）注释（***）
（5）特殊字符（***）
（6）CDATA区（了解）
（7）PI指令（了解）

5、xml的元素（标签）定义（*****）
** 标签定义

** 标签定义有开始必须要有结束：<person></person>
** 标签没有内容，可以在标签内结束 ; <aa/>
** 标签可以嵌套，必须要合理嵌套
*** 合理嵌套 <aa><bb></bb></aa>
*** 不合理嵌套 <aa><bb></aa></bb>: 这种方式是不正确的
** 一个xml中，只能有一个根标签，其他标签都是这个标签下面的标签

** 在xml中把空格和换行都当成内容来解析，
**** 下面这两段代码含义是不一样的
* <aa>1111111</aa>
* <aa>
11111111111
</aa>

** xml标签可以是中文

** xml中标签的名称规则
（1）xml代码区分大小写
 :这两个标签是不一样的
（2）xml的标签不能以数字和下划线(_)开头
<2a> <_aa>: 这样是不正确的
（3）xml的标签不能以xml、XML、Xml等开头
<xmla> <XmlB> <XMLC>: 这些都是不正确的
（4）xml的标签不能包含空格和冒号
<a b> <b:c> : 这些是不正确的

6、xml中属性的定义（*****）
* html是标记型文档，可以有属性
* xml也是标记型文档，可以有属性

* <person id1="aaa" id2="bbb"></person>

** 属性定义的要求
（1）一个标签上可以有多个属性
<person id1="aaa" id2="bbb"></person>
（2）属性名称不能相同
<person id1="aaa" id1="bbb"></person>：这个是不正确，不能有两个id1
（3）属性名称和属性值之间使用= ，属性值使用引号包起来（可以是单引号，也可以是双引号）
（4）xml属性的名称规范和元素的名称规范一致

7、xml中的注释（*****）
* 写法 
** 注意的地方
**** 注释不能嵌套
 -->
 -->
** 注释也不能放到第一行，第一行第一列必须放文档声明

8、xml中的特殊字符（*****）
* 如果想要在xml中现在 a >

9、CDATA区（了解）
* 可以解决多个字符都需要转义的操作 if(af) {}
* 把这些内容放到CDATA区里面，不需要转义了
** 写法
<![CDATA[ 内容 ]]>
- 代码
<![CDATA[ if(af) {} ]]>
** 把特殊字符，当做文本内容，而不是标签

10、PI指令（处理指令）（了解）
* 可以在xml中设置样式
* 写法： <?xml-stylesheet type="text/css" href="css的路径"?>

* 设置样式，只能对英文标签名称起作用，对于中文的标签名称不起作用的。

** xml的语法的总结
所有 XML 元素都须有关闭标签
XML 标签对大小写敏感
XML 必须正确地嵌套顺序
XML 文档必须有根元素(只有一个)
XML 的属性值须加引号
特殊字符必须转义 --- CDATA
XML 中的空格、回车换行会解析时被保留

11、xml的约束
* 为什么需要约束？
** 比如现在定义一个person的xml文件，只想要这个文件里面保存人的信息，比如name age等，但是如果在xml文件中
写了一个标签<猫>，发现可以正常显示，因为符合语法规范。但是猫肯定不是人的信息，xml的标签是自定义的，需要技术来
规定xml中只能出现的元素，这个时候需要约束。

* xml的约束的技术： dtd约束和 schema约束（看懂）

12、dtd的快速入门
* 创建一个文件后缀名 .dtd

步骤：
（1）看xml中有多少个元素，有几个元素，在dtd文件中写几个 <!ELEMENT>
（2）判断元素是简单元素还是复杂元素
- 复杂元素：有子元素的元素
<!ELEMENT 元素名称 (子元素)>
- 简单元素：没有子元素
<!ELEMENT 元素名称 (#PCDATA)>
（3）需要在xml文件中引入dtd文件
<!DOCTYPE 根元素名称 SYSTEM "dtd文件的路径">

** 打开xml文件使用浏览器打开的，浏览器只负责校验xml的语法，不负责校验约束

** 如果想要校验xml的约束，需要使用工具（myeclipse工具）

** 打开myeclipse开发工具
*** 创建一个项目 day05
*** 在day05的src目录下面创建一个xml文件和一个dtd文件
*** 当xml中引入dtd文件之后，比如只能出现name age，多写了一个a，会提示出错

13、dtd的三种引入方式
（1）引入外部的dtd文件
<!DOCTYPE 根元素名称 SYSTEM "dtd路径">
（2）使用内部的dtd文件
- <!DOCTYPE 根元素名称 [
<!ELEMENT person (name,age)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
]>
（3）使用外部的dtd文件（网络上的dtd文件）
<!DOCTYPE 根元素 PUBLIC "DTD名称" "DTD文档的URL">
- 后面学到框架 struts2 使用配置文件使用外部的dtd文件
- <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.0//EN"
"http://struts.apache.org/dtds/struts-2.0.dtd">

14、使用dtd定义元素
* 语法： <!ELEMENT 元素名约束>

* 简单元素：没有子元素的元素
<!ELEMENT name (#PCDATA)>
*** (#PCDATA): 约束name是字符串类型
*** EMPTY : 元素为空（没有内容）
- <sex></sex>
*** ANY:任意
* 复杂元素：
<!ELEMENT person (name,age,sex,school)>
- 子元素只能出现一次
* <!ELEMENT 元素名称 (子元素)>

* 表示子元素出现的次数
+ : 表示一次或者多次
? ：表示零次或者一次
* ：表示零次或者多次

* 子元素直接使用逗号进行隔开 ,
** 表示元素出现的顺序

* 子元素直接使用|隔开
** 表示元素只能出现其中的任意一个

15、使用dtd定义属性
* 语法： <!ATTLIST 元素名称
属性名称属性类型属性的约束
>

* 属性类型
- CDATA: 字符串
- <!ATTLIST birthday
ID1 CDATA #REQUIRED
>

- 枚举：表示只能在一定的范围内出现值，但是只能每次出现其中的一个
** 红绿灯效果
** (aa|bb|cc)
- <!ATTLIST age
ID2 (AA|BB|CC) #REQUIRED
>

- ID: 值只能是字母或者下划线开头
- <!ATTLIST name
ID3 ID #REQUIRED
>

* 属性的约束
- #REQUIRED：属性必须存在

- #IMPLIED：属性可有可无

- #FIXED: 表示一个固定值 #FIXED "AAA"
- 属性的值必须是设置的这个固定值
- <!ATTLIST sex
ID4 CDATA #FIXED "ABC"
>
- 直接值
* 不写属性，使用直接值
* 写了属性，使用设置那个值
- <!ATTLIST school
ID5 CDATA "WWW"
>

16、实体的定义
* 语法： <!ENTITY 实体名称 "实体的值">
*** <!ENTITY TEST "HAHAHEHE">
*** 使用实体 &实体名称; 比如 &TEST;

** 注意
* 定义实体需要写在内部dtd里面，
如果写在外部的dtd里面，有某些浏览器下，内容得不到

17、xml的解析的简介（写到java代码）（***今天最重要的内容*****）
* xml是标记型文档
* js使用dom解析标记型文档？
- 根据html的层级结构，在内存中分配一个树形结构，把html的标签，属性和文本都封装成对象
- document对象、element对象、属性对象、文本对象、Node节点对象

* xml的解析方式（技术）：dom 和 sax
** 画图分析使用dom和sax解析xml过程
*** dom解析和sax解析区别：
** dom方式解析
* 根据xml的层级结构在内存中分配一个树形结构，把xml的标签，属性和文本都封装成对象
* 缺点：如果文件过大，造成内存溢出
* 优点：很方便实现增删改操作

** sax方式解析
* 采用事件驱动，边读边解析
- 从上到下，一行一行的解析，解析到某一个对象，返回对象名称
* 缺点：不能实现增删改操作
* 优点：如果文件过大，不会造成内存溢出，方便实现查询操作

* 想要解析xml，首先需要解析器
** 不同的公司和组织提供了针对dom和sax方式的解析器，通过api方式提供
*** sun公司提供了针对dom和sax解析器 jaxp
*** dom4j组织，针对dom和sax解析器 dom4j（*** 实际开发中****）
*** jdom组织，针对dom和sax解析器 jdom

18、jaxp的api的查看
** jaxp是javase的一部分

** jaxp解析器在jdk的javax.xml.parsers包里面
** 四个类：分别是针对dom和sax解析使用的类
*** dom：
DocumentBuilder : 解析器类
- 这个类是一个抽象类，不能new，
此类的实例可以从 DocumentBuilderFactory.newDocumentBuilder() 方法获取

- 一个方法，可以解析xml parse("xml路径") 返回是 Document 整个文档
- 返回的document是一个接口，父节点是Node，如果在document里面找不到想要的方法，到Node里面去找

- 在document里面方法
getElementsByTagName(String tagname)
-- 这个方法可以得到标签
-- 返回集合 NodeList

createElement(String tagName)
-- 创建标签

createTextNode(String data)
-- 创建文本

appendChild(Node newChild)
-- 把文本添加到标签下面

removeChild(Node oldChild)
-- 删除节点

getParentNode()
-- 获取父节点

NodeList list
- getLength() 得到集合的长度
- item(int index)下标取到具体的值
for(int i=0;i<list.getLength();i++) {
list.item(i)
}

getTextContent()
- 得到标签里面的内容

DocumentBuilderFactory：解析器工厂
- 这个类也是一个抽象类，不能new
newInstance() 获取 DocumentBuilderFactory 的实例。

*** sax：
SAXParser：解析器类
SAXParserFactory: 解析器工厂

19、使用jaxp实现查询操作
*** 查询xml中所有的name元素的值
* 步骤
//查询所有name元素的值
/*
* 1、创建解析器工厂
DocumentBuilderFactory.newInstance();
* 2、根据解析器工厂创建解析器
builderFactory.newDocumentBuilder();
* 3、解析xml返回document
* Document document = builder.parse("src/person.xml");
* 4、得到所有的name元素
使用document.getElementsByTagName("name");
* 5、返回集合，遍历集合，得到每一个name元素
- 遍历 getLength() item()
- 得到元素里面值使用 getTextContent()
* */

*** 查询xml中第一个name元素的值
* 步骤
/*
* 1、创建解析器工厂
* 2、根据解析器工厂创建解析器
* 3、解析xml，返回document
*
* 4、得到所有name元素
* 5、使用返回集合，里面方法 item，下标获取具体的元素
NodeList.item(下标)：集合下标从0开始
* 6、得到具体的值，使用 getTextContent方法
*
* */

20、使用jaxp添加节点
*** 在第一个p1下面（末尾）添加 <sex>nv</sex>
**步骤
/*
* 1、创建解析器工厂
* 2、根据解析器工厂创建解析器
* 3、解析xml，返回document
*
* 4、得到第一个p1
* - 得到所有p1，使用item方法下标得到

* 5、创建sex标签 createElement
* 6、创建文本 createTextNode
* 7、把文本添加到sex下面 appendChild

* 8、把sex添加到第一个p1下面　appendChild
*
* 9、回写xml
* */

21、使用jaxp修改节点
*** 修改第一个p1下面的sex内容是nan
** 步骤
/*
* 1、创建解析器工厂
* 2、根据解析器工厂创建解析器
* 3、解析xml，返回document
*
* 4、得到sex item方法
* 5、修改sex里面的值
*** setTextContent方法
*
* 6、回写xml
* */

22、使用jaxp删除节点
*** 删除<sex>nan</sex>节点
** 步骤
/*
* 1、创建解析器工厂
* 2、根据解析器工厂创建解析器
* 3、解析xml，返回document
*
* 4、获取sex元素
* 5、获取sex的父节点使用getParentNode方法
* 6、删除使用父节点删除 removeChild方法
*
* 7、回写xml
* */

23、使用jaxp遍历节点
** 把xml中的所有元素名称打印出来
** 步骤
/*
* 1、创建解析器工厂
* 2、根据解析器工厂创建解析器
* 3、解析xml，返回document
*
* ====使用递归实现=====
* 4、得到根节点
* 5、得到根节点子节点
* 6、得到根节点子节点的子节点
* */
** 遍历的方法
//递归遍历的方法
private static void list1(Node node) {
//判断是元素类型时候才打印
if(node.getNodeType() == Node.ELEMENT_NODE) {
System.out.println(node.getNodeName());
}

//得到一层子节点
NodeList list = node.getChildNodes();
//遍历list
for(int i=0;i<list.getLength();i++) {
//得到每一个节点
Node node1 = list.item(i);
//继续得到node1的子节点
//node1.getChildNodes()
list1(node1);
}
}

javaweb学习第六天：xml重点知识点总结

猜你喜欢