栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Java

XML解析

Java 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

XML解析

这次使用的代码来自:

https://zhuanlan.zhihu.com/p/191476342

xml解析

xml文件主要用来传输数据,作为配置文件,或者存储数据。不管做为哪种应用,最终都需要把xml中的数据解析出来。就必须研究xml的解析。解析xml技术其实是W3C组织指定的。而其他的编程语言都对W3C组织给出的解析xml的规则做了适合自己语言的实现。

Java语言解析xml文档

sun公司针对W3C组织指定的xml的解析也做了自己的实现。

JAXP解析:
DOM 是 XML Document Object Model 的缩写,即 XML 文档对象模型。

DOM解析:先把整个xml文件加载内存中。然后从头开始解析。会得到一个dom树。这样我们就可以获取xml中的任何一个标签对象,就可以获取到其中的标签的属性,文本等信息。

SAX解析:一边读一边仍。读一行解析一行。

第三方公司也指定了基于W3C给的解析规则,指定了更加灵活的解析:
jdom解析,dom4j解析,pull解析

学习dom for java:dom4j解析:dom4j解析不是sun公司的技术。而是第三方公司给出的技术,我们要使用dom4j就必须到dom4j官网去下载他们的jar包。

DOM

根据 DOM,XML 文档中的每个成分都是一个节点。

DOM 是这样规定的:

1.整个文档(文件)是一个文档节点 - document

2.每个 XML 标签是一个元素节点 - element - 节点,元素,标签

3.包含在 XML 元素中的文本是文本节点,text

4.每一个 XML 属性是一个属性节点 ,attribute

5.注释属于注释节点

方法有:

getElementsByTagName(TagName) 返回拥有指定标签名的所有元素。其中的元素的顺序是它们在源文档中出现的顺序。

如:x 是一个节点对象

1.x.getElementsByTagName(name) - 获取带有指定标签名称的所有元素

2.x.appendChild(node) - 向 x 插入子节点

3.x.removeChild(node) - 从 x 删除子节点

4.x.nodeName - x 的名称

5.x.nodeValue - x 的值

6.x.parentNode - x 的父节点

7.x.childNodes - x 的子节点

8.x.attributes - x 的属性节点

9.setAttribute() - 为某个元素添加属性

展示的代码

xml文件



    
        冰与火之歌
        乔治马丁
        2014
        89
    
    
        安徒生童话
        2004
        77
        English
        

Java文件

package xml;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;

import org.w3c.dom.Document;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

public class Demo1 {
	public static void main(String[] args) throws Exception {
        //创建一个DocumentBuilderFactory的对象
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
        //创建一个DocumentBuilder的对象
        //创建DocumentBuilder对象
        DocumentBuilder db = dbf.newDocumentBuilder();
        //通过DocumentBuilder对象的parser方法加载books.xml文件到当前项目下
        Document document = db.parse("src/xml/books.xml");
        //获取所有book节点的集合
        NodeList bookList = document.getElementsByTagName("book");
        //通过nodelist的getLength()方法可以获取bookList的长度
        System.out.println("一共有" + bookList.getLength() + "本书");
        //遍历每一个book节点
        for (int i = 0; i < bookList.getLength(); i++) {
            System.out.println("=================下面开始遍历第" + (i + 1) + "本书的内容=================");
            //通过 item(i)方法 获取一个book节点,nodelist的索引值从0开始
            Node book = bookList.item(i);
            //获取book节点的所有属性集合
            NamedNodeMap attrs = book.getAttributes();
            System.out.println("第 " + (i + 1) + "本书共有" + attrs.getLength() + "个属性");
            //遍历book的属性
            for (int j = 0; j < attrs.getLength(); j++) {
                //通过item(index)方法获取book节点的某一个属性
                Node attr = attrs.item(j);
                //获取属性名
                System.out.print("属性名:" + attr.getNodeName());
                //获取属性值
                System.out.println("--属性值" + attr.getNodeValue());
            }
            //解析book节点的子节点
            NodeList childNodes = book.getChildNodes();
            //遍历childNodes获取每个节点的节点名和节点值
            System.out.println("第" + (i+1) + "本书共有" + 
            childNodes.getLength() + "个子节点");
            for (int k = 0; k < childNodes.getLength(); k++) {
                //区分出text类型的node以及element类型的node
                if (childNodes.item(k).getNodeType() == Node.ELEMENT_NODE) {
                    //获取了element类型节点的节点名
                    System.out.print("第" + (k + 1) + "个节点的节点名:" 
                    + childNodes.item(k).getNodeName());
                    //获取了element类型节点的节点值
                    System.out.println("--节点值是:" + childNodes.item(k).getFirstChild().getNodeValue());
                    //System.out.println("--节点值是:" + childNodes.item(k).getTextContent());
                }
            }
            System.out.println("======================结束遍历第" + (i + 1) + "本书的内容=================");
        }
	}
}
Dom4j

由于DOM技术的解析,存在很多缺陷,比如内存溢出,解析速度慢等问题,所以就出现了DOM4J解析技术,DOM4J技术的出现大大改进了DOM解析技术的缺陷。

DOM4J 表现更优秀,具有性能优异、功能强大和极端易用使用的特点,只要懂得DOM基本概念,就可以通过dom4j的api文档来解析xml。dom4j是一套开源的api。实际项目中,往往选择dom4j来作为解析xml的利器。

使用步骤:

1:导入dom4j的依赖包

2:创建SAXReader实例对象:来读取XML文档

3:使用SAXReader对象的read方法读取xml文件

4:对xml文件中的元素进行操作(CRUD)

Java文件

package xml;

import java.awt.print.Book;
import java.io.File;
import java.util.ArrayList;
import java.util.Iterator;
import java.util.List;

import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

public class Demo2 {
    public static void main(String[] args) throws Exception {
        // 解析books.xml文件
        // 创建SAXReader的对象reader
        SAXReader reader = new SAXReader();
        // 通过reader对象的read方法加载books.xml文件,获取docuemnt对象。
        Document document = reader.read(new File("src/xml/books.xml"));
        // 通过document对象获取根节点bookstore
        Element bookStore = document.getRootElement();
        // 通过element对象的elementIterator方法获取迭代器
        Iterator it = bookStore.elementIterator();
        // 遍历迭代器,获取根节点中的信息(书籍)
        while (it.hasNext()) {
            System.out.println("=====开始遍历某一本书=====");
            Element book = (Element) it.next();
            // 获取book的属性名以及 属性值
            List bookAttrs = book.attributes();
            for (Attribute attr : bookAttrs) {
                System.out.println("属性名:" + attr.getName() + "--属性值:"
                        + attr.getValue());
            }
            Iterator itt = book.elementIterator();
            while (itt.hasNext()) {
                Element bookChild = (Element) itt.next();
                System.out.println("节点名:" + bookChild.getName() + "--节点值:" + bookChild.getStringValue());
            }
            System.out.println("=====结束遍历某一本书=====");
        }
    }
}
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/841737.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号