梅花雪,看你神气到几时——乱码判断
ccton 2004-12-24 08:36:41 下载的网页,部分出现乱码,一大段文章中就那么几个字是乱码。
如何判断哪几个字是乱码?不重新下载的话,如何修复?
我认为是某一个字节下载过程中出现了问题,结果造成乱码。问题是一个字符出现乱码如何影响到后面的一串字符呢?
曾经碰到过比较怪的事情,用editplus和记事本打开一个文件,只有不超过10个字是乱码。但是用JS通过FSO读进去,一alert,乱码影响到后面更多的字。用正则检查,从第一个乱码字开始,一溜都是0xFF,就是null值。不过,不是每个有问题的网页都是出现0xFF。
假定我们可以在二进制方式下检查文本,那么含有这种乱码的文本,一般有啥特征?