php乱码问题请教

dfsr 2012-01-05 06:26:03

网站是使用ide开发的，语言自然是php。ide编码默认也设置为utf-8的了(即每一个文件的编码都是utf-8的），数据库也用了utf8_general_ci的编码格式，数据库是mysql的。每一页中的header('Content-Type: text/html; charset=utf-8')和<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />也都设了，并且mysql_query('SET NAMES UTF8')也加上了。
现在的问题是在本地发布文章再读出来，都正常，放到远程服务器上页面显示就是乱码，但是使用phpMyAdmin查看数据库内容也是正常的，现求教高人？

...全文

93 14 打赏收藏转发到动态举报

写回复

14 条回复

切换为时间正序

请发表友善的回复…

发表回复

Steve 2012-01-06

打赏
举报

回复

网页编码改为gb2312，这些内容是可以正常显示的

这些“正常显示”的都是gb2312，这些正常的都是不正常的，应该都改成UTF-8.

dfsr 2012-01-06

打赏
举报

回复

数据库是空间提供商的，php.ini我不知道如何操作，目前能做的是就是导入表直接设置为utf8的。
如果右键把网页编码改为gb2312，这些内容是可以正常显示的。但是其他内容就乱了。

dfsr 2012-01-06

打赏
举报

回复

[Quote=引用 13 楼 runffer_yang 的回复:]

网页编码改为gb2312，这些内容是可以正常显示的

这些“正常显示”的都是gb2312，这些正常的都是不正常的，应该都改成UTF-8.
[/Quote]
这个我也知道，关键是找不到解决办法才来求助吗。

uicestone 2012-01-05

打赏
举报

回复

同楼上学习。。
[Quote=引用 9 楼 runffer_yang 的回复:]

php.ini不同造成内部encode不同。
[/Quote]

jackfans 2012-01-05

打赏
举报

回复

[Quote=引用 9 楼 runffer_yang 的回复:]
php.ini不同造成内部encode不同。
[/Quote]
这个得学习下！！

Steve 2012-01-05

打赏
举报

回复

php.ini不同造成内部encode不同。

LuciferStar 2012-01-05

打赏
举报

回复

问题应该还是在入库的时候出错了。

LuciferStar 2012-01-05

打赏
举报

回复

UTF8的web和mysql，那么就不需要set names了

josph2012 2012-01-05

打赏
举报

回复

[Quote=引用 4 楼 phpnewnew 的回复:]
放到远程服务器上页面显示就是乱码，

那么远程服务器上的的数据库编码是否正常?
[/Quote]

恩，对。查看远程数据库编码。

第一，查数据库本身编码

第二，查表编码

yiwusuo 2012-01-05

打赏
举报

回复

你的是国外的空间服务器么？如果是，再找我告诉你解决办法。

黄袍披身 2012-01-05

打赏
举报

回复

放到远程服务器上页面显示就是乱码，

那么远程服务器上的的数据库编码是否正常?

Steve 2012-01-05

打赏
举报

回复

mysql_query("SET NAMES utf8",$db);

qq277049 2012-01-05

打赏
举报

回复

浏览器右键看看什么编码。。

qq277049 2012-01-05

打赏
举报

回复

输出header头也是UTF8的吗？

最近一直在研究爬虫和Lucene，虽然开始决定选用Heritrix来执行爬虫操作，但是后来发现用它来做还是存在一定的问题，比如需要程序生成相应的XML文件，对于同一个Job，怎样才能保证重复运行该Job时文件夹始终是同一个（Heritrix为Job创建文件夹的规则是“Job名称-时间戳”）等等，都是需要考虑的问题，最终还是将其搁浅。　　后来google了一下，找到了一个简单爬虫的程序代码（http://www.blogjava.net/Jack2007/archive/2008/03/24/188138.html），随即试验了一下，发现确实能得到网页的内容，在这里还是要谢谢代码的提供者——Jack.Wang。　　虽然试验成功，但是在随后的大数据量试验时，还是出现了问题。最初试验时，我只是让程序去抓取10个URL链接，当我将URL链接数改为100个时，问题出现了——URL中存在重复，而且非常容易的就变成死循环。举个例子来说，比如我首先爬的是A.html，在A.html中有两个链接：B.html，C.html，等爬完A.html以后，程序会爬B.html，这时如果B.html中的所有链接中有A.html这个页面的链接，那么程序又会去爬A.html这个页面，如此一来就形成了一个死循环，永远也不能停止。　　跟踪程序发现，原来是在添加要抓取的网页的链接列表中，没有将已经抓取过的URL去除，所以才造成了死循环。现在虽然加上了这个判断，但是从我运行程序的效果来看，也不是很理想，总是感觉有些慢，800个页面要一两分钟才能爬完，这个我觉得有点说不过去。　　这个产品，做到现在，我遇到了这么几个情况，有和大家分享的，也有向大家请教，求助的。　　 1.关于对应关系数据的保存方式　　在创建索引的时候，需要将网页的URL和网页的内容传到相应的方法中，当然URL和内容是要对应的，也许是经验太少吧，我采取的是通过构建一个JavaBean的方式来传递的，不知道大家有没有更好的方法　　　　 2.关于要创建索引的内容的保存方式　　最初的想法是不创建文件，直接将内容保存到变量中，然后创建索引，即先抓取网页的内容，然后将网页的内容和URL保存到自己构建的JavaBean对象中，接着将这个对象放到一个list列表中，等所有网页抓取完毕以后，将这个列表传到创建索引的方法中。这种做法看似不错，可是当URL数量很大时，会导致内存不够用，所以还是创建文件比较稳妥。　　 3.关于网页编码问题　　遇到这个问题也是一个巧合，本来我抓取的是客户的一个网站，后来同事说如果客户看访问日志，这个月的数据会和平常的数据不一样，所以我就抓取公司的网站，结果，问题出现了。原先公司的网站是用GB2312编码做的页面，现在采用的是UTF-8的编码，虽然我已经判断了页面的编码，可是依然不能解决保存的文件中文乱码的问题，不知道大家有什么好办法没有。错误信息为：java.io.UnsupportedEncodingException 　　附件为爬虫代码本文出自 “徘徊在c＃，java，php之间” 博客，请务必保留此出处http://jerrysun.blog.51cto.com/745955/221879

乱码的问题分为很多种，很多人一见到有乱码就开始骂mysql，其实很多情况下并不是mysql造成的。从乱码产生的原因来分析，乱码的产生一般有以下几种情况。1、网页编码与程序编码不一致的问题所谓的网页编码问题就是指你的html代码中定义的“charset”，例如以下这段代码：Chat Tutorial Application他设置了浏览器端采用gb2312的字符集，此时如果程序使用的是utf8的编码(...

JAVA初学者遇到的常见问题就是中文乱码问题，但是导致中文乱码的原因有很多，经常搞得焦头烂额。这个视频帮助大家解决日常编程中常见的中文问题。

PHP 乱码使用最土模板里的post请求源码如下static public function DoPost($url,$post_data=array()){$url2 = parse_url($url);$url2["path"] = ($url2["path"] == "" ? "/" : $url2["path"]);$url2["port"] = ($url2["port"] == "" ...

file_get_contents 采集一个页面的数据，获取的数据是乱码，已经使用了检测编码的方式，检测的是utf-8,我的页面编码也是utf-8，但是还是显示乱码，不知道为什么$url="xxx";$opts = array( 'http'=>array( 'user_agent' => "Mozilla/4.0 (compatible; MSIE 5.01; Windo...

21,886

社区成员

140,364

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章