梅花雪,看你神气到几时——乱码判断

ccton 2004-12-24 08:36:41
下载的网页,部分出现乱码,一大段文章中就那么几个字是乱码。
如何判断哪几个字是乱码?不重新下载的话,如何修复?

我认为是某一个字节下载过程中出现了问题,结果造成乱码。问题是一个字符出现乱码如何影响到后面的一串字符呢?

曾经碰到过比较怪的事情,用editplus和记事本打开一个文件,只有不超过10个字是乱码。但是用JS通过FSO读进去,一alert,乱码影响到后面更多的字。用正则检查,从第一个乱码字开始,一溜都是0xFF,就是null值。不过,不是每个有问题的网页都是出现0xFF。

假定我们可以在二进制方式下检查文本,那么含有这种乱码的文本,一般有啥特征?
...全文
463 28 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
28 条回复
切换为时间正序
请发表友善的回复…
发表回复
ccton 2004-12-28
  • 打赏
  • 举报
回复
up
ccton 2004-12-28
  • 打赏
  • 举报
回复
你说的解码出错有可能,我考虑不用IE,自己写个解码器试试看。

唉,我用的VB,处理字节数据不是很顺手,老是用个循环在那里整,慢得要死。还没找到合适的API
onekey 2004-12-27
  • 打赏
  • 举报
回复
分太少了,不回答~~~~~~~~
cxz7531 2004-12-27
  • 打赏
  • 举报
回复
很可能是一些特殊字符,或者是别的语言,把ie更新装上相应的语言包
xdspower 2004-12-27
  • 打赏
  • 举报
回复
可能你网络环境上有过滤吧?你前后数据都完整,只有几个字符出错的的情况我真的没有见到过,最多是没有后面的内容了的情况。
超级大笨狼 2004-12-27
  • 打赏
  • 举报
回复
嘿嘿:)
jonescheng 2004-12-27
  • 打赏
  • 举报
回复
看看老大的风范。。
楼主可真的要改一改
meizz 2004-12-27
  • 打赏
  • 举报
回复
这个问题我无能为力了:
1. JS是依托浏览器而生存的, 在加载的时候可能连JS都未加载完就出错, 这样JS根本就没法子起效
2. 即使JS起效, 可以侦测网页内容, 它没有判断是错字符的能力, 乱码与正常码之间有何区别? 这个JS怎么判断??
3. 若是普通的JS代码出错, 可以通过截获 window.onerror 来判断出错的理由, 可是这种乱码不会触发 onerror 事件, 即网页不认为它是一种错误.
4. 在客户端的JS还没有很好的办法对文本进行二进制的分析.
ccton 2004-12-27
  • 打赏
  • 举报
回复
cxz7531(大花猫) ( ) 信誉:99 2004-12-27 11:26:53 得分: 0
很可能是一些特殊字符,或者是别的语言,把ie更新装上相应的语言包
-----------------------------------

这个肯定不是的,刷新,没变好再刷新,就好了。所以不是你说的问题,呵呵。



ccton 2004-12-27
  • 打赏
  • 举报
回复
meizz(梅花雪) :有一些事,PM你可好?
ccton 2004-12-27
  • 打赏
  • 举报
回复
michael_monkey(从头再来):纠正一下:美学研究生!

xdspower():打开新浪的新闻页,我看10次有5次会有乱码地,须刷新才不见。

jonescheng(C#前进无极限):改了就不再是楼主了

michael_monkey 2004-12-27
  • 打赏
  • 举报
回复
是个研究生,对我有些崇拜

房间是开了的,但是没有上去,怕麻烦!!!
GageCSDN 2004-12-27
  • 打赏
  • 举报
回复
楼主不厚道~太不厚道了!

知错要改,还是好孩子~~~~
bison82 2004-12-27
  • 打赏
  • 举报
回复
高手门。我借个地方问个问题:例如我的文件放在E:/LSX. 用javascript怎么去读出E:/LSX中的E出来呢?也就是把盘符读出来啊?
lcs560 2004-12-27
  • 打赏
  • 举报
回复
嗨,林子大了什么鸟都有!
life360 2004-12-27
  • 打赏
  • 举报
回复
现在的年代,什么鸟都有。。。。。。。。
xdspower 2004-12-27
  • 打赏
  • 举报
回复
我觉得楼主说的情况基本上是不存在的,由于http是基于tcp的,传送数据过程中出现楼主所说的情况是不可能的(可能很主观,反正我是没有碰见过的),楼主的局部乱码其实下载的数据也是完整的,只不过客户端可能有某种原因而不能正常解析,或者解析不正确出现错位,特别是一些混合编码的文档最容易出现这样的问题。
killerdanny 2004-12-27
  • 打赏
  • 举报
回复
初生牛犊不怕虎!
  • 打赏
  • 举报
回复
字节不全,可以用asc分析从几到几的
whb147 2004-12-27
  • 打赏
  • 举报
回复
做人要厚道!!!!!!!!!!!
加载更多回复(8)

87,997

社区成员

发帖
与我相关
我的任务
社区描述
Web 开发 JavaScript
社区管理员
  • JavaScript
  • 无·法
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧