XML解析非法字符问题,有什么好办法可以解决?100分救命啊!!!
有这样一个应用,把一个一定格式的文本文件,当做纪录集通过XML文件对应,导入到数据库,现在这个文本文件里有一些非法字符(比如UE hex模式下码为1C的字符,在记事本中显示为小黑块,在UE非 hex模式下显示正常),会导致导入时XML解析出错..
问了一位朋友,他说一般ascii码<20的都是非法字符,除了回车换行的0A,0D,因此他建议我导入前选把文本文件过滤一下,把ascii码<20的字符都删掉,照他的意思好像是要把文件中00到19的字符都查找一遍,有没有什么方法,比如正则表达式,可以把这10多个查询写一起的,并都替换成空,有没有人处理过相关类似的问题啊??
救命啊