社区
基础编程
帖子详情
唠叨老大还在么?XML解析出错求助,5555
countstars
2007-06-25 02:41:51
<?xml version="1.0" encoding="gb18030" ?>
<xml>咔咓吚.</xml>
怎么确保标签中的字符符合XML?要做什么处理?
真的很难确保XML文档准确性,让它能够让PHP的XML解析函数解析
有没有正则之类的XML解析器。
我只想解析这个文档,如何去掉/转意这些字符?这些字符都包括什么字符?
谢谢
...全文
593
27
打赏
收藏
唠叨老大还在么?XML解析出错求助,5555
咔咓吚. 怎么确保标签中的字符符合XML?要做什么处理? 真的很难确保XML文档准确性,让它能够让PHP的XML解析函数解析 有没有正则之类的XML解析器。 我只想解析这个文档,如何去掉/转意这些字符?这些字符都包括什么字符? 谢谢
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
27 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
1024*1024
2011-11-24
打赏
举报
回复
[\\x00-\\x08\\x0b-\\x0c\\x0e-\\x1f] 我就是想知道这些都是什么特殊字符
hejunbin
2007-09-21
打赏
举报
回复
标记
bcc1o
2007-09-21
打赏
举报
回复
。。是LZ
bcc1o
2007-09-21
打赏
举报
回复
我靠 怎么发现这里最少的都是两个裤子 除了我
咔咓吚 LS啊 你怎么用日本语言呢 真是
fxs_2008
2007-09-21
打赏
举报
回复
学习学习!
countstars
2007-09-20
打赏
举报
回复
php 的 xml 解析函数不能解析非utf-8编码的宽字符文档
需要自行编程解决,记得我发过一个的
------------
就是想看你那个,再拿出来晒晒吧-___-!!!
懒得去死
2007-09-19
打赏
举报
回复
记得以前我用GB2312的 。结果和其他做CS的同事搞了一天,最后放弃了。改了UTF-8
bcc1o
2007-09-19
打赏
举报
回复
我都是gb2312
xuzuning
2007-09-19
打赏
举报
回复
php 的 xml 解析函数不能解析非utf-8编码的宽字符文档
需要自行编程解决,记得我发过一个的
countstars
2007-09-19
打赏
举报
回复
XML实在是恶心,真不知道怎么办才好
Mistruster
2007-07-02
打赏
举报
回复
那你就把
chr(7) 转成
chr(8) 转成
chr(9) 转成
chr(10) 转成
... ...
countstars
2007-07-01
打赏
举报
回复
嗯,你这样处理或许不错,不过把非法字符过滤掉了,那就不能保证原样显示,就像CSDN一样,有时候还是很不方便的,很难提供原始数据。
Mistruster
2007-07-01
打赏
举报
回复
呵呵,我一般这样:
function SBC_DBC($Str)
{
//---- 全角都转成半角 ----
$Queue = Array(
'0' => '0', '1' => '1', '2' => '2', '3' => '3', '4' => '4',
'5' => '5', '6' => '6', '7' => '7', '8' => '8', '9' => '9',
'A' => 'A', 'B' => 'B', 'C' => 'C', 'D' => 'D', 'E' => 'E',
'F' => 'F', 'G' => 'G', 'H' => 'H', 'I' => 'I', 'J' => 'J',
'K' => 'K', 'L' => 'L', 'M' => 'M', 'N' => 'N', 'O' => 'O',
'P' => 'P', 'Q' => 'Q', 'R' => 'R', 'S' => 'S', 'T' => 'T',
'U' => 'U', 'V' => 'V', 'W' => 'W', 'X' => 'X', 'Y' => 'Y',
'Z' => 'Z', 'a' => 'a', 'b' => 'b', 'c' => 'c', 'd' => 'd',
'e' => 'e', 'f' => 'f', 'g' => 'g', 'h' => 'h', 'i' => 'i',
'j' => 'j', 'k' => 'k', 'l' => 'l', 'm' => 'm', 'n' => 'n',
'o' => 'o', 'p' => 'p', 'q' => 'q', 'r' => 'r', 's' => 's',
't' => 't', 'u' => 'u', 'v' => 'v', 'w' => 'w', 'x' => 'x',
'y' => 'y', 'z' => 'z', '-' => '-', '!' => '!', '。' => '.',
',' => ',', '%' => '%', '、' => ',', '#' => '#', '¥' => '$',
'*' => '*', '(' => '(', ')' => ')', '|' => '|', '+' => '+',
'[' => '[', ']' => ']', '{' => '{', '}' => '}', '~' => '~',
':' => ':', ';' => ';', '/' => '/', '?' => '?', '—' => '-',
'“' => '"', '”' => '"', '‘' => "'", '’' => "'", '·' => '.'
);
$Str = preg_replace("/([\xA3][\xA1-\xAF\xB0-\xBF\xC1-\xDA\xE1-\xFC])/e", "\$Queue[\\1]", $Str);
$Str = preg_replace("/([\xA1][\xA1-\xAF\xB0-\xB9])/e", "\$Queue[\\1]", $Str);
return($Str);
}
function replace_xml($str)
{
//---- XML 非法字符过滤 ----
$str = SBC_DBC($str);
$str = preg_replace("/[\\x00-\\x08\\x0b-\\x0c\\x0e-\\x1f]/", '', $str);
$str = preg_replace("/[\r\n]+/", "\n", $str);
$str = preg_replace("/[ \t]+/", " ", $str);
$str = trim($str);
$str = htmlspecialchars($str);
return $str;
}
//... ...
$str = "... ...";
$str = replace_xml($str);
//... ...
Mistruster
2007-07-01
打赏
举报
回复
上面弄错了
htmlspecialchars 应该先转码再放到 <xml></xml> 里的
Mistruster
2007-07-01
打赏
举报
回复
$str = "<xml>咔咓吚.</xml>";
//.....
$str = preg_replace("/[\\x00-\\x08\\x0b-\\x0c\\x0e-\\x1f]/", '', $str);
$str = htmlspecialchars($str);
countstars
2007-07-01
打赏
举报
回复
我不知道CSDN贴子显示里,是如何找到那个字符并把它去掉的
countstars
2007-07-01
打赏
举报
回复
其中一个字符ord后是7,所以没办法直接发,只能先编码,所以你们一定要用那段。。。
countstars
2007-07-01
打赏
举报
回复
先把我哪段代码,转意后,存为XML文档,用IE打开,看看错误信息,再讨论,CDATA没用的
mrshelly
2007-07-01
打赏
举报
回复
jom_ch 就回答到点上了.
只是CSDN自动把 "<" 转为 "<" 了.
<?xml version="1.0" encoding="gb18030" ?>
<xml><![CDATA[咔咓吚</test>.]]></xml>
countstars
2007-07-01
打赏
举报
回复
你们先把那段encode后的编码decode后用PHP解析函数解析看看,再说问题吧
加载更多回复(7)
玩转 Android MediaPlayer之视频预加载(优化)
本文是在《玩转 Android MediaPlayer之视频预加载》基础上做更进一步的优化,适应更多终端的MediaPlayer,不再
唠叨
预加载的作用和基础,有兴趣的读者请看上回。
JAVA使用JAXB解析复杂XML
唠叨
话 目前网络上比较流行的数据传输方式当属:Json、字节流、XML了,说实话我个人更喜欢Json和字节流的方式进行数据传输。以下是我对这三种数据传输方式的几点见解: 三者都各有优缺点,根据需求的不同选择合适的数据传输方式。 Json在数据传输时能够保留绝大多数的数据结构属性,且数据冗余度也较小,解析方便。 XMl在数据传输时更能体现数据的结构属性且更灵活,但数据冗余度相对另外两种方式要大的多...
30天快速从零开始Java基础入门到高级编程
语言拒绝
唠叨
:直白、通俗易懂 拒绝晦涩难懂的呆板教学,语言生动幽默,举例形象深入浅出,迅速让你把握问题本质,四两拨千斤; 思维方式: “大处着眼,小处着手” “逆向思维,反证法” “透过问题看本质”
使用python解析Wordpress导出的xml文件
在用wordpress导出日志时,得到的往往是xml文件,具体形式如下:
链表操作 big bang
题目描述 复习考研累了的时候看看一集二十分钟左右的《生活大爆炸》也不失为一种乐趣。在剧中Sheldon可以说是一个极品,真不知Leonard是如何忍受这位极品室友成天的
唠叨
。 你知道么?Sheldon有一个神秘的小本本,记录了所有他从小开始讨厌的人名。Stuart这位漫画店老板就是小本本的一员哦,谁叫他常常毫不客气地挤兑Sheldon,曾多次赌赢过Sheldon呢。 Penn
基础编程
21,886
社区成员
140,364
社区内容
发帖
与我相关
我的任务
基础编程
从PHP安装配置,PHP入门,PHP基础到PHP应用
复制链接
扫一扫
分享
社区描述
从PHP安装配置,PHP入门,PHP基础到PHP应用
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章