通过URL获取网页源文件内容出现乱码

快乐无边 2009-08-18 09:23:21
using System.Net;
using System.IO;

public static string GetSourceTextByUrl(string url)
{
WebRequest request = WebRequest.Create(url);
request.Timeout = 20000;//20秒超时
WebResponse response = request.GetResponse();
Stream resStream = response.GetResponseStream();
StreamReader sr = new StreamReader(resStream);
return sr.ReadToEnd();
}
...全文
315 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
zzxap 2009-08-18
  • 打赏
  • 举报
回复

System.Text.Encoding.Default 告诉
StreamReader 目前操作系统的编码即可。

StreamReader reader = new StreamReader(FileName, System.Text.Encoding.Default)
caofan520 2009-08-18
  • 打赏
  • 举报
回复
什么网址我帮你解决
LutzMark 2009-08-18
  • 打赏
  • 举报
回复
你得根据抓取页面的编码来确定获取流的编码
zzxap 2009-08-18
  • 打赏
  • 举报
回复
StreamReader sr=new StreamReader(fs,System.Text.Encoding.GetEncoding("GB2312"));
zzxap 2009-08-18
  • 打赏
  • 举报
回复
当用c#的时候,在网页返回的时候,有一个类是可以获得他的编码方式的,

就是HttpWebResponse的CharacterSet方法,他是可以得到网页的编码格式的,因此你就根据这一个方式来处理和保存网页就可以了,

还有一点要说明,有的网页是没有写入自己是什么编码的,你得设置一个默认的编码,很简单,你现在在哪里,如果你在America的话,你当然可以是ansic

但是你在中国的话,请一定要记住,中国的编码是gb2312,大小写对你是没有什么影响的,

在网页保存的时候,你要用到一个方法,就是streamWriter方法,他有一种好的指定编码格式,在他的构造函数里指定编码格式,

StreamWriter(string path,bool ut,Encoding youcoding)

62,046

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术交流专区
javascript云原生 企业社区
社区管理员
  • ASP.NET
  • .Net开发者社区
  • R小R
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见,支持健康理性的辩论和互动,反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。

试试用AI创作助手写篇文章吧