SAXParser解析XML时非法字符的问题

chenbo8546 2009-06-18 02:13:53

使用SAX方法解析XML字符串。如果字符串中包含非法字符(ﾒ$G()这样的内容的时候，解析的时候会异常。
异常信息为："An invalid XML character (Unicode: 0x1b) was found in the element content of the document." "org.apache.xerces.parsers.AbstractSAXParser.parse(Unknown Source)。

那个非法字符(ﾒ$G()是颜文字，日本手机上使用的一种图片文字。在一般浏览器中打开都是乱码，好像字符编码格式不是UTF-8的。
哪位能知道怎么解决？
或者告诉我具体的原因是什么？或者是SAXParser里面支持的编码范围等等。

...全文

373 5 打赏收藏转发到动态举报

写回复

5 条回复

切换为时间正序

请发表友善的回复…

发表回复

zuguanqun 2009-06-29

打赏
举报

回复

java.net.URLEncoder.encode() 吧

top00zw 2009-06-29

打赏
举报

回复

xml生命的编码格式改成那几个字符的格式呢？统一用一种编码格式试试

chenbo8546 2009-06-25

打赏
举报

回复

每天上来看一遍。。。。

chenbo8546 2009-06-19

打赏
举报

回复

怎么没有人回帖啊？大家都不知道吗？

http://www.blogjava.net/dongbule/archive/2010/09/28/333262.html 先感谢同事renial的<解析xml时遇到的一些问题>技术分享,下面是一些记录和实际操作 1.使用Dom4j解析大文件时内存溢出的问题问题是这样的,当我用dom4j去解析一个几十M的xml时,就出现out of memory.当然了,这也是...

[code="java"]import java.io.InputStream; import java.util.ArrayList; import java.util.List; import javax.xml.parsers.SAXParser; import javax.xml.parsers.SAXParserFactory; import org.xml.sax.A...

本文主要涉及:xml概念描述,xml的约束文件,dtd,xsd文件的定义使用,如何在xml中引用xsd文件,如何使用java解析xml,解析xml方式dom sax,dom4j解析xml文件 XML来源SGML SGML(SGM)标准通用标记语言是一种定义电子文档结构和描述其内容的国际标准语言,具有极好的扩展性是所有电子文档标记语言的起源，早在万维网发明之前“通用标言”就已存在是1...

SaxHelperpackage com.example.bukaios.testxml; import android.util.Log; import org.xml.sax.Attributes; import org.xml.sax.SAXException; import org.xml.sax.helpers.DefaultHandler; import java.util.A...

现在的软件项目都不是独立的一个项目，都是多系统协调工作。这样的话就涉及到系统间的通讯，通讯就会跟报文传输挂上关系。系统间使用怎样的报文格式进行通讯呢？有的使用固定长度格式报文；有的使用变长格式报文；有的使用 XML格式报告。本场 Chat 主要和大家分享一下 XML 格式报文的解析。Java 是一个开源的语言，本场 Chat 将给大家介绍一下常用的 XML 解析框架及特点。主要内容： XML ...

62,614

社区成员

307,326

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章