通过URL获取网页源文件内容出现乱码

快乐无边 2009-08-18 09:23:21

using System.Net;
using System.IO;

public static string GetSourceTextByUrl(string url)
{
WebRequest request = WebRequest.Create(url);
request.Timeout = 20000;//20秒超时
WebResponse response = request.GetResponse();
Stream resStream = response.GetResponseStream();
StreamReader sr = new StreamReader(resStream);
return sr.ReadToEnd();
}

...全文

315 5 打赏收藏转发到动态举报

写回复

用AI写文章

5 条回复

切换为时间正序

请发表友善的回复…

发表回复

zzxap 2009-08-18

打赏
举报

用
System.Text.Encoding.Default 告诉
StreamReader 目前操作系统的编码即可。

StreamReader reader = new StreamReader(FileName, System.Text.Encoding.Default)

caofan520 2009-08-18

打赏
举报

什么网址我帮你解决

LutzMark 2009-08-18

打赏
举报

你得根据抓取页面的编码来确定获取流的编码

zzxap 2009-08-18

打赏
举报

StreamReader sr=new StreamReader(fs,System.Text.Encoding.GetEncoding("GB2312"));

zzxap 2009-08-18

打赏
举报

当用c#的时候，在网页返回的时候，有一个类是可以获得他的编码方式的，

就是HttpWebResponse的CharacterSet方法，他是可以得到网页的编码格式的，因此你就根据这一个方式来处理和保存网页就可以了，

还有一点要说明，有的网页是没有写入自己是什么编码的，你得设置一个默认的编码，很简单，你现在在哪里，如果你在America的话，你当然可以是ansic

但是你在中国的话，请一定要记住，中国的编码是gb2312,大小写对你是没有什么影响的，

在网页保存的时候，你要用到一个方法，就是streamWriter方法，他有一种好的指定编码格式，在他的构造函数里指定编码格式，

StreamWriter(string path,bool ut,Encoding youcoding)