SAXParser解析XML时非法字符的问题

chenbo8546 2009-06-18 02:13:53
使用SAX方法解析XML字符串。如果字符串中包含非法字符(メ$G()这样的内容的时候,解析的时候会异常。
异常信息为:"An invalid XML character (Unicode: 0x1b) was found in the element content of the document." "org.apache.xerces.parsers.AbstractSAXParser.parse(Unknown Source)。

那个非法字符(メ$G()是 颜文字,日本手机上使用的一种图片文字。在一般浏览器中打开都是乱码,好像字符编码格式不是UTF-8的。
哪位能知道怎么解决?
或者告诉我具体的原因是什么?或者是SAXParser里面支持的编码范围等等。
...全文
373 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
zuguanqun 2009-06-29
  • 打赏
  • 举报
回复
java.net.URLEncoder.encode() 吧
top00zw 2009-06-29
  • 打赏
  • 举报
回复
xml生命的编码格式改成那几个字符的格式呢?统一用一种编码格式试试
chenbo8546 2009-06-25
  • 打赏
  • 举报
回复
每天上来看一遍。。。。
chenbo8546 2009-06-19
  • 打赏
  • 举报
回复
怎么没有人回帖啊? 大家都不知道吗?

62,614

社区成员

发帖
与我相关
我的任务
社区描述
Java 2 Standard Edition
社区管理员
  • Java SE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧