SAXParser解析XML时非法字符的问题
使用SAX方法解析XML字符串。如果字符串中包含非法字符(メ$G()这样的内容的时候,解析的时候会异常。
异常信息为:"An invalid XML character (Unicode: 0x1b) was found in the element content of the document." "org.apache.xerces.parsers.AbstractSAXParser.parse(Unknown Source)。
那个非法字符(メ$G()是 颜文字,日本手机上使用的一种图片文字。在一般浏览器中打开都是乱码,好像字符编码格式不是UTF-8的。
哪位能知道怎么解决?
或者告诉我具体的原因是什么?或者是SAXParser里面支持的编码范围等等。