一种解析XML文件时对节点元素的处理方法

    公开(公告)号:CN101996252B

    公开(公告)日:2013-01-16

    申请号:CN201010547334.2

    申请日:2010-11-17

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种用于解决大型XML文件的处理效率问题的XML节点元素索引信息表示方法。现有的文档对象模型在解析大型XML文件的应用中均存在一定的缺陷:DOM对计算机的性能和内存要很高的要求;SAX在处理文件编码和文件编辑时存在困难。本发明的特征在于在解析XML文件时,将原始XML文件以字节数组的形式读入内存;在加载文件的同时,扫描文件内容,并且为每一个扫描得到的节点创建索引信息,节点索引信息中的各信息单元以定长的整数形式保存。本发明加载XML文件时直接将XML文件以字节数组形式读入内存,加载效率高,速度快;索引信息以整数形式保存,容易编程处理;索引信息长度固定,实现了高效率检索。