请教网页编码的问题?

ukgg88 2012-02-15 08:08:03
我做了一些网页,都是如下的编码:
<meta http-equiv="content-type"content="text/html; charset=gb2312"/>

我想把它们都改成如下编码:
<meta http-equiv="content-type"content="text/html; charset=UTF-8"/>

可是我把网页中的UTF-8替换成gb2312,保存上传,网页上的编码还是指向gb2312,没有变;那我就给它改回来,可是用程序打开网页,奇怪的是网页变成了乱码,不知是何原因?请教老师指点。谢谢。
...全文
85 10 打赏 收藏 转发到动态 举报
写回复
用AI写文章
10 条回复
切换为时间正序
请发表友善的回复…
发表回复
冷月心凝 2012-02-17
  • 打赏
  • 举报
回复
<meta http-equiv="content-type"content="text/html; charset=gb2312"/>
你想把原有文件的编码格式从gb2312->utf-8的时候,要注意,你不仅要把charset=gb2312变成charset=utf-8,第二步,就是把你的文件用txt文本文档打开,另存为的时候,选择一下编码格式utf-8!!然后再用相关的编程软件打开看看检查一下!
ukgg88 2012-02-17
  • 打赏
  • 举报
回复
成功,但就是原来显示时间的js,在UTF-8中出现乱码了。
ukgg88 2012-02-17
  • 打赏
  • 举报
回复
[Quote=引用 8 楼 yuelenglingxi 的回复:]

<meta http-equiv="content-type"content="text/html; charset=gb2312"/>
你想把原有文件的编码格式从gb2312->utf-8的时候,要注意,你不仅要把charset=gb2312变成charset=utf-8,第二步,就是把你的文件用txt文本文档打开,另存为的时候,选择一下编码格式utf-8!!然后再用相关的编程软件打开看看检……
[/Quote]非常感谢指点。
xmlife 2012-02-16
  • 打赏
  • 举报
回复
用dreamweaver转换下
liyoc 2012-02-16
  • 打赏
  • 举报
回复
这个问题我以前也遇到过, 呵呵

我当时是新建一个 utf8 的空白文件, 然后复制代码过去, 保存。

其实编辑器也有编码设置的, 可以设置为utf8, 因为你的代码在网页上没有乱, 而是编辑器乱了, 估计是本地在打架, 呵呵
ukgg88 2012-02-16
  • 打赏
  • 举报
回复
[Quote=引用 5 楼 xmlife 的回复:]

用dreamweaver转换下
[/Quote]如何转换?
ukgg88 2012-02-16
  • 打赏
  • 举报
回复
[Quote=引用 5 楼 xmlife 的回复:]

用dreamweaver转换下
[/Quote]如何转换?
dalmeeme 2012-02-16
  • 打赏
  • 举报
回复
需要用DW或记事本打开该源文件,另存为utf-8编码格式才行。
夜风插画 2012-02-15
  • 打赏
  • 举报
回复
有些东西不是随便能改的,要看服务器和你的空间是支持什么样的类型。
Acesidonu 2012-02-15
  • 打赏
  • 举报
回复
文件要保存成相应的格式,不光改文本上的字符集
最近一直在研究爬虫和Lucene,虽然开始决定选用Heritrix来执行爬虫操作,但是后来发现用它来做还是存在一定的问题,比如需要程序生成相应的XML文件,对于同一个Job,怎样才能保证重复运行该Job时文件夹始终是同一个(Heritrix为Job创建文件夹的规则是“Job名称-时间戳”)等等,都是需要考虑的问题,最终还是将其搁浅。    后来google了一下,找到了一个简单爬虫的程序代码(http://www.blogjava.net/Jack2007/archive/2008/03/24/188138.html),随即试验了一下,发现确实能得到网页的内容,在这里还是要谢谢代码的提供者——Jack.Wang。    虽然试验成功,但是在随后的大数据量试验时,还是出现了问题。最初试验时,我只是让程序去抓取10个URL链接,当我将URL链接数改为100个时,问题出现了——URL中存在重复,而且非常容易的就变成死循环。举个例子来说,比如我首先爬的是A.html,在A.html中有两个链接:B.html,C.html,等爬完A.html以后,程序会爬B.html,这时如果B.html中的所有链接中有A.html这个页面的链接,那么程序又会去爬A.html这个页面,如此一来就形成了一个死循环,永远也不能停止。    跟踪程序发现,原来是在添加要抓取的网页的链接列表中,没有将已经抓取过的URL去除,所以才造成了死循环。现在虽然加上了这个判断,但是从我运行程序的效果来看,也不是很理想,总是感觉有些慢,800个页面要一两分钟才能爬完,这个我觉得有点说不过去。    这个产品,做到现在,我遇到了这么几个情况,有和大家分享的,也有向大家请教,求助的。    1.关于对应关系数据的保存方式    在创建索引的时候,需要将网页的URL和网页的内容传到相应的方法中,当然URL和内容是要对应的,也许是经验太少吧,我采取的是通过构建一个JavaBean的方式来传递的,不知道大家有没有更好的方法       2.关于要创建索引的内容的保存方式    最初的想法是不创建文件,直接将内容保存到变量中,然后创建索引,即先抓取网页的内容,然后将网页的内容和URL保存到自己构建的JavaBean对象中,接着将这个对象放到一个list列表中,等所有网页抓取完毕以后,将这个列表传到创建索引的方法中。这种做法看似不错,可是当URL数量很大时,会导致内存不够用,所以还是创建文件比较稳妥。    3.关于网页编码问题    遇到这个问题也是一个巧合,本来我抓取的是客户的一个网站,后来同事说如果客户看访问日志,这个月的数据会和平常的数据不一样,所以我就抓取公司的网站,结果,问题出现了。原先公司的网站是用GB2312编码做的页面,现在采用的是UTF-8的编码,虽然我已经判断了页面的编码,可是依然不能解决保存的文件中文乱码的问题,不知道大家有什么好办法没有。错误信息为:java.io.UnsupportedEncodingException    附件为爬虫代码 本文出自 “徘徊在c#,java,php之间” 博客,请务必保留此出处http://jerrysun.blog.51cto.com/745955/221879
logo 设计不会,就这样先凑合了写道 Fuseblog预备开发带在线SHOP功能的个人博客系统.仿照Appfuse 提供一个完全自动化的ant构建脚本.在线SHOP的数据库建模图例已经 在博客中贴出.感兴趣的和我一起搭建,嘻嘻 文档博客地址: http://forum.sinomagazine.com 开发环境: Jcreator-4.5 JDK-1.5 Ant-1.6.1 MYSQL-5 Tomcat-5.5 Spring-2.5.6 Ibatis-2.3.4 问题事项: 1.在windows系统中,命令行中执行ant命令时,当指定的 构建脚本文件中包含中文字符,而构建脚本文件的编码是UTF-8时将会 Invalid byte 1 of 1-byte UTF-8 sequence. 的错误.这个问题尚未 知解决,故先采用GBK的编码. 2.在Jcreator中创建的项目,不支持UTF-8编码,缺省GBK. 以下先列出初步的的ant构建文件的代码: build.xml 问题,并保证构建成功。 二、工具篇: 持续集成 ... by lixw 2008-09-09 回复 (3) 网络相册开发(6)——ant 自动 ... 在工程目录下创建libs/hibernate/ ,放入 hibernate-tools-3.2.0.ga.jar jtidy-4aug2000r7-dev.jar build.properties project.name=sw project.version=1.0 basedir=. build.dir =${basedir}/build web.dir = ${basedir}/WebR ... by vyyv 2009-03-12 回复 (1) ant配置文件实例详解 build.xml 代码 xml version="1.0" encoding="UTF-8"?> 问题。 Antenna介绍 Ant ... by pandonix 2007-08-28 回复 (9) 用Ant 来编译打包您的Anroid应用 ... 通过 activityCreator.py --out myproject your.package.name.ActivityName 命令可以生成一个project ,生成project下面有个bulid.xml 文件,那个东西就可以帮你打包生成了。 来看下ant是怎么做的。 问题,包括诸如功能:网页装载行动,无缝的跟faces的导航整合,动态视图的ID分配和管理参数分析,无需配置,兼容其他JSF框架。P ... by zly06 2009-09-09 回复 (0) 相关博客 ant模板 < ? xml version = "1.0" ?> < project name= "tax-calculator" default= "package" > < property name= "src.dir" location= "src" / > ... by article2008 2008-07-30 回复 (0) 代码备份build.xml

61,115

社区成员

发帖
与我相关
我的任务
社区描述
层叠样式表(英文全称:Cascading Style Sheets)是一种用来表现HTML(标准通用标记语言的一个应用)或XML(标准通用标记语言的一个子集)等文件样式的计算机语言。
社区管理员
  • HTML(CSS)社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧