xml 特殊字符 xml 的特殊字符的处理方法

软件发布|下载排行|最新软件

当前位置:首页IT学院IT技术

xml 特殊字符 xml 的特殊字符的处理方法

  2021-03-22 我要评论
想了解xml 的特殊字符的处理方法的相关内容吗,在本文为您仔细讲解xml 特殊字符的相关知识和一些Code实例,欢迎阅读和指正,我们先划重点:xml,特殊字符,xml,特殊字符转义,xml特殊字符处理,下面大家一起来学习吧。

遇到这一方面的问题是因为我试图把一个对象序列化之后存贮到xml文件中,然后从xml文件中读取字符串,并反序列化对象(hadoop mapreduce程序中通过JobConf向tasktracker传送对象)。

有关序列化:

当我把序列化之后的数据直接存在xml中后,在解析xml时遇到解析错误,原因是有非法字符。在详细阅读xml的说明之后才发现:< > ' " &是不允许作为xml的PCDATA的。要使用这几个字符,必须要把他们替换为内建实体:

实体引用  字符

< <
> >
& &
" "
' '

所以,最直接的方法就是自己控制,在写入xml文件时把特殊字符转为实体引用,在读取的时候,再转回来。当然还有另外一个方法就是不把字符串当PCDATA,而是当成CDATA来使用(没有测试)。

 用实体引用的方法太麻烦,而我的应用xml的格式不能自己规定,所以只好寻找另外的方法:BASE64编码。这是一种常用在网络传输数据的编码方式。把存在这些非法字符的字符编码成base64编码,就不会有这些字符了。最重要的是java api中提供了这种编码的编码器和解码器,位于sun.misc的BASE64Encoder和BASE64Decoder。这样就可以把序列化之后得到的字节流转化成字符串了。并且也可以存贮在xml文件中。

不过这两个类并不是sun的开放api,编译会有警告。

猜您喜欢

Copyright 2022 版权所有 软件发布 访问手机版

声明:所有软件和文章来自软件开发商或者作者 如有异议 请与本站联系 联系我们