抓取网页中文乱码,求解
展涛 2012-07-30 05:19:28 我抓取的网页是:http://www.newegg.com.cn 网页的编码是gb2312.
我用的系统是英文系统,无论怎么改抓取的源代码都是乱码,中文系统是没问题。
下面是我写的Code:
WebResponse res = req.GetResponse();
Stream resStream = res.GetResponseStream();
StreamReader sr = new StreamReader(resStream, Encoding.UTF8); //试过用default,utf-8抓取的网页源代码都是乱码
string result= sr.ReadToEnd();
返回的result是乱码(英文系统)
我请教各位大虾的是在编程的时候怎样抓取网页代码是正常的。
不能用以下方法:在系统安装中文补丁。(代码适应系统,非系统适应代码)。
我曾找解码的方法,没试成功,可能方法有误。哪位大虾请帮帮忙。急急急!!