XML编程-DOM4J

基本概述

dom4j是一个Java的XML API，类似于jdom，用来读写XML文件的。dom4j是一个十分优秀的JavaXML API，具有性能优异、功能强大和极其易使用的特点，同时它也是一个开放源代码的软件，可以在SourceForge上找到它。在IBM developerWorks上面还可以找到一篇文章，对主流的Java XML API进行的性能、功能和易用性的评测，所以可以知道dom4j无论在哪个方面都是非常出色的。如今可以看到越来越多的Java软件都在使用dom4j来读写XML，特别值得一提的是连Sun的JAXM也在用dom4j。这已经是必须使用的jar包， Hibernate也用它来读写配置文件。

PS：DOM4J功能那么强大的原因之一就是它支持XPath技术，DOM4J也有相应的参考文档，需要的可以自行搜索下载。

为什么会有DOM4J？

之前，博客里阐述的两门技术，DOM和SAX技术，前者的缺点是耗费内存，后者的缺点是只能进行读取操作，而DOM4J既可以提交效率，也可以进行crud操作。

PS：使用DOM4J需要导入相应基本JAR包，如果使用DOM4J的扩展功能，还需要导入扩展JAR包。

DOM4J使用入门

DOM4J获得document对象的三种方法

1.读取XML文件,获得document对象(常用)

    SAXReader reader = new SAXReader();    document   document = reader.read(new File(“src/input.xml"));

2.解析XML形式的文本,得到document对象

    String text = "";    document document = documentHelper.parseText(text);

3.主动创建document对象

    document document = documentHelper.createdocument();    //创建根节点    Element root = document.addElement("members");

PS：注意要导入相应JAR包。

节点对象

1、获取文档的根节点

    Element root = document.getRootElement();

2、取得某个节点的子节点

    Element element=node.element(“书名");

3、取得节点的内容

    String text1=node.getText();    String text2=node.getTextTrim();// 去掉内容前面和后面的空格

4、取得某节点下所有名为“member”的子节点，并进行遍历

    List nodes = rootElm.elements("member");    for (Iterator it = nodes.iterator(); it.hasNext();) {          Element elm = (Element) it.next();          // do something    }

5、对某节点下的所有子节点进行遍历

    for(Iterator it=root.elementIterator();it.hasNext();){        Element element = (Element) it.next();           // do something      }

6、在某节点下添加子节点

    Element ageElm = newMemberElm.addElement("age");

7、设置节点文字

    element.setText("29");

8、删除某节点

    //childElm是待删除的节点,parentElm是其父节点    parentElm.remove(childElm);

9、添加一个CDATA节点

    Element contentElm = infoElm.addElement("content");    contentElm.addCDATA(diary.getContent());

PS：注意不能跨层访问节点。

节点对象属性

1、取得某节点下的某属性

    Element root=document.getRootElement();          //属性名name    Attribute attribute=root.attribute("size");

2、取得属性的文字

     String text=attribute.getText();

3、删除某属性

    Attribute attribute=root.attribute("size");    root.remove(attribute);

4、遍历某节点的所有属性

     Element root=document.getRootElement();        for(Iterator it=root.attributeIterator();it.hasNext();){           Attribute attribute = (Attribute) it.next();           String text=attribute.getText();            System.out.println(text);     }

5、设置某节点的属性和文字

    newMemberElm.addAttribute("name", "sitinspring");

6、设置属性的文字

    Attribute attribute=root.attribute("name");     attribute.setText("sitinspring");

在指定位置插入节点

1.得到插入位置的节点列表（list）

2.调用list.add(index,elemnent)，由index决定element的插入位置。

Element元素可以通过documentHelper对象得到。示例代码：

    Element aaa = documentHelper.createElement("aaa");    aaa.setText("aaa");    List list = root.element("书").elements();    list.add(1, aaa);    //更新document

将文档写入XML文件

1、如果文档是全英文

XMLWriter writer = new XMLWriter(new  FileWriter("output.xml"));writer.write(document);writer.close();

2、如果文档含有中文

OutputFormat outputFormat = OutputFormat.createPrettyPrint();outputFormat.setEncoding("utf-8");XMLWriter xmlWriter = new XMLWriter(new FileOutputStream("src/com/pc/XML8.xml"), outputFormat);xmlWriter.write(document);xmlWriter.close();

PS：出现乱码的原因是因为输出字符集不能识别中文，这样可以通过OutputFormat的setEncoding方法设置为”UTF-8”，然后再使用XMLWriter这种形参的(OutputStream out, OutputFormat format) 构造方构造方法，就能解决乱码问题了，至于为什么会用createPrettyPrint方法，是因为这样做输出的格式更符合人的阅读习惯。

综合案例

XML8.xml

<班级 班次="1班" 编号="C1"><学生 学号="n1" 性别="男" 授课方式="面授" 朋友="n2" 班级编号="C1"><名字>张三<年龄>20<介绍>不错<学生 学号="n2" 性别="女" 授课方式="面授" 朋友="n1 n3" 班级编号="C1"><名字>李四<年龄>18<介绍>很好<学生 学号="n3" 性别="男" 授课方式="面授" 朋友="n2" 班级编号="C1"><名字>王五<年龄>22<介绍>非常好<学生 性别="男" 班级编号="C1"><名字>小明<年龄>30<介绍>好

package com.pc;import java.io.File;import java.io.FileNotFoundException;import java.io.FileOutputStream;import java.io.FileWriter;import java.io.IOException;import java.io.UnsupportedEncodingException;import java.util.Iterator;import java.util.List;import org.dom4j.document;import org.dom4j.documentException;import org.dom4j.documentHelper;import org.dom4j.Element;import org.dom4j.io.OutputFormat;import org.dom4j.io.SAXReader;import org.dom4j.io.XMLWriter;public class XML8 {// 使用DOM4j对XML进行CRUD操作public static void main(String[] args) throws Exception {// 1.得到解析器SAXReader saxReader = new SAXReader();// 2.指定解析哪个XML文件document document = saxReader.read(new File("src/com/pc/XML8.xml"));// list(document.getRootElement());// read(document);// readByXPath(document);// add(document);// delete(document);// updateElement(document);// updateAttribute(document);// addByIndex(document, 3);}// 更新属性(修改所有班级编号为C2)public static void updateAttribute(document document) throws Exception {// 得到所有学生List students = document.getRootElement().elements("学生");for (Element e : students) {// 修改班级编号e.addAttribute("班级编号", "C2");}updateToXML(document);}// 更新元素(将所有学生的年龄+3)public static void updateElement(document document) throws Exception {// 得到所有学生List students = document.getRootElement().elements("学生");for (Element e : students) {// 取出年龄Element age = e.element("年龄");age.setText(Integer.parseInt(age.getTextTrim()) + 3 + "");}updateToXML(document);}// 删除元素(删除第一个学生)public static void delete(document document) throws Exception {// 找到元素Element stu = document.getRootElement().element("学生");// 删除stu.getParent().remove(stu);// 更新updateToXML(document);}// 添加元素到指定位置public static void addByIndex(document document, int index)throws Exception {// 创建一个元素Element newStu = documentHelper.createElement("学生");newStu.setText("小花");// 得到所有学生的listList students = document.getRootElement().elements("学生");// 按索引添加students.add(index, newStu);// 更新updateToXML(document);}// 添加元素(添加一个学生到xml中)public static void add(document document) throws Exception {// 创建一个学生节点对象Element newStu = documentHelper.createElement("学生");// 给元素添加属性newStu.addAttribute("学号", "n4");Element newStuName = documentHelper.createElement("名字");Element newStuAge = documentHelper.createElement("年龄");Element newStuIntro = documentHelper.createElement("介绍");// 把子元素挂载到学生节点下newStu.add(newStuName);newStu.add(newStuAge);newStu.add(newStuIntro);// 将学生挂载在根节点下document.getRootElement().add(newStu);// 更新updateToXML(document);}private static void updateToXML(document document)throws UnsupportedEncodingException, FileNotFoundException,IOException {// 更新xml文件// 直接输出会出现中文乱码OutputFormat outputFormat = OutputFormat.createPrettyPrint();outputFormat.setEncoding("utf-8");XMLWriter xmlWriter = new XMLWriter(new FileOutputStream("src/com/pc/XML8.xml"), outputFormat);xmlWriter.write(document);xmlWriter.close();}// xpath技术，跨层读取某个元素public static void readByXPath(document document) throws Exception {// 取出第一个学生Element student = (Element) document.selectSingleNode("/班级/学生[1]");System.out.println("姓名：" + student.elementText("名字") + "t年龄："+ student.elementText("年龄") + "t介绍："+ student.elementText("介绍") + "t性别："+ student.attributevalue("性别"));}// 读取指定的某个元素(读取第一个学生的信息)public static void read(document document) throws Exception {// 得到根元素Element root = document.getRootElement();// root.elements("学生"); 取出root元素下的所有学生元素// root.element("学生"); 取出root元素下的第一个学生元素// 取出root元素下的第一个学生元素Element student = (Element) root.elements("学生").get(0);System.out.println("姓名：" + student.elementText("名字") + "t年龄："+ student.elementText("年龄") + "t介绍："+ student.elementText("介绍") + "t性别："+ student.attributevalue("性别"));}// 遍历xml文件public static void list(Element element) {System.out.println("元素名称：" + element.getName() + "t元素内容："+ element.getTextTrim());Iterator iterator = element.elementIterator();while (iterator.hasNext()) {Element e = iterator.next();// 递归list(e);}}}

以上就是XML编程-DOM4J的内容，更多相关内容请关注PHP中文网（www.kaotop.com）！

XML编程-DOM4J

XML编程-DOM4J

基本概述

为什么会有DOM4J？

DOM4J使用入门

DOM4J获得document对象的三种方法

1.读取XML文件,获得document对象(常用)

2.解析XML形式的文本,得到document对象

3.主动创建document对象

节点对象

1、获取文档的根节点

2、取得某个节点的子节点

3、取得节点的内容

4、取得某节点下所有名为“member”的子节点，并进行遍历

5、对某节点下的所有子节点进行遍历

6、在某节点下添加子节点

7、设置节点文字

8、删除某节点

9、添加一个CDATA节点

节点对象属性

1、取得某节点下的某属性

2、取得属性的文字

3、删除某属性

4、遍历某节点的所有属性

5、设置某节点的属性和文字

6、设置属性的文字

在指定位置插入节点

将文档写入XML文件

1、如果文档是全英文

2、如果文档含有中文

综合案例

NLP相关栏目本月热门文章