C#如何获取网站网页的正常编码的源码内容???

qushui 2003-10-11 03:46:00

我的方法如下，获取url为http://www.sohu.com就出现汉字乱码？对于日文登就更不用说了
如何让程序自动的识别???????????????????????????
public string WebClientGetSource(string url)
{
string source="";
try
{
WebClient client=new WebClient();
Stream data=client.OpenRead(url);
StreamReader reader=new StreamReader(data,Encoding.Unicode);
string strTemp="";
while((strTemp=reader.ReadLine())!=null)
{
source+=strTemp+"\r\n";
}

}
catch(WebException exp)
{
MessageBox.Show(exp.Message,"Exception");
}
return source;
}

...全文

129 5 打赏收藏转发到动态举报

写回复

5 条回复

切换为时间正序

请发表友善的回复…

发表回复

qushui 2003-10-13

打赏
举报

回复

哦，同意楼上的说法，要是真正的正确先是编码，要读取两次
1，一次获取网页的charset
2.第二次以改编码进行读取

速马 2003-10-12

打赏
举报

回复

WebClient client = new WebClient();
byte[] data = client.DownoadData(url);
string str = System.Text.Encoding.Default.GetString(data);

//这边没有装VS.NET,大概就是上面那样了,自己试试看...

ArLi2003 2003-10-12

打赏
举报

回复

建议你先用ASCII 载入，然后寻找 http-equiv="Content-Type" 一行再根据 charset= 得出编码再用相应的方法再解一次。

jp311 2003-10-12

打赏
举报

回复

楼上的方法也不中呀，看来还是根据charset靠的住些

jp311 2003-10-11

打赏
举报

回复

StreamReader reader=new StreamReader(data, Encoding.GetEncoding("GB2312"));
可以解决中文编码的网站，不知道有什么办法可以得到网页的字符编码？？？

在日常编码过程中，我们常常会进行自动化测试。这里的自动化测试不是指单元测试，而是模拟人工输入来进行快速的、高并发的测试。可以使用的自动化工具有LOADRUNNER，以及目前在VS2010中的功能很强大的测试工作平台...

ICanSeeYou远程控制软件（所有C#源代码）另外附有说明文档。原程序（安装包）的下载地址： http://download1.csdn.net/down3/20070428/28022416404.rar<br/><br/>源代码说明： <br/>IDE（集成开发...

原文地址：C#获取网页源码，自动判断网页字符集编码[转] 最近开始打算重新学习C#，并且尝试做点C#练习。而最让我感兴趣的还是和网站相关的东西。那就做个获取网站源码，采集文章的功能吧。根据网上的资料，使用...

c#获取网页源代码的5种方式，发送请求获取响应数据流，按照不同的编码转换为响应字符串测试代码static void Main() { string back = getwebcode1("http://blog.csdn.net/luanpeng825485697?viewmode=contents", ...

在ASP.NET(C#)中，获取网页源代码貌似有很多种方法，我随便搞了一个简单的WebClient，非常简单容易。但后面一个非常恼火的问题出来了，那就是中文的乱码。通过仔细研究，中文的网页不外乎GB2312和UTF-8这两种编码。...

110,536

社区成员

642,578

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

让您成为最强悍的C#开发者

试试用AI创作助手写篇文章吧

+ 用AI写文章