sharp0309 2011年01月04日
CInternetSession读取网页源码乱码问题?
关于用CInternetSession与CHttpFile获取网页内容乱码的问题

vs2005环境下
在项目属性那里设置 字符集 为 Unicode 编码(不要改字符集)
在获取到页面的源码内容为乱码(其他网页不会出现乱码,只有搜狐出现)
这是我的部分源码,有些UTF-8的经过处理也没有问题,搜狐是GB2312的,是用下面这些代码来获取的,总是会出现乱码!

牛人帮我看看啊!!!(注意只有搜狐出现乱码问题)

CInternetSession session;
CString strBody=_T("");
session.SetOption(INTERNET_OPTION_CONNECT_TIMEOUT,1000*30); //连接超时设置
session.SetOption(INTERNET_OPTION_CONNECT_BACKOFF,1000); //在重试连接之间的等待的延时值在毫秒级
session.SetOption(INTERNET_OPTION_CONNECT_RETRIES,1); CHttpFile* httpfile=NULL;
try
{
httpfile=(CHttpFile*)session.OpenURL(_T("http://news.sohu.com/20101230/n278604307.shtml"),1,INTERNET_FLAG_TRANSFER_ASCII|INTERNET_FLAG_RELOAD,NULL,0);
}
catch(CInternetException* m_pException)
{
httpfile=NULL;
m_pException->Delete();
return _T("");
}
char cBuf[4096]={0};
if(httpfile)
{
while (nBuf = httpfile->Read(cBuf,4095))
{
cBuf[nBuf]=0;
strBody+=cBuf;
}
}
if (httpfile)
{
httpfile->Close();
delete httpfile;
}
}

session.Close();
return strBody;
...全文
455 点赞 收藏 8
写回复
8 条回复

还没有回复,快来抢沙发~

发动态
发帖子
网络编程
创建于2007-09-28

7878

社区成员

6.4w+

社区内容

VC/MFC 网络编程
社区公告
暂无公告