还是InternetReadFile显示乱码的问题

hkpsa008 2015-02-15 11:29:24
之前问过这个问题没解决 地址 http://bbs.csdn.net/topics/390986757
HOOK InternetReadFile 在里面显示获取到网页的源码 都是乱码 (不是转码问题,包括英文也是乱码),GB2312则正常
测试的是获取百度的首页页面,不知道是不是转换数据类型这出的问题,InternetReadFile第二个参数是LPVOID类型 ,不通过HOOK直接调用的话用 PBYTE接受就没问题呢,请问下如果用HOOK的方式 到底怎么显示第二个参数接受的数据呢
BOOL WINAPI CWininetHook::_InternetReadFile(HINTERNET hFile,LPVOID lpBuffer,DWORD dwNumberOfBytesToRead,LPDWORD lpdwNumberOfBytesRead )
{

MessageBox(NULL,(char*)lpBuffer,"",0);//乱码 包括英文
BOOL isBool=s_pfnInternetReadFile(hFile,lpBuffer,dwNumberOfBytesToRead,lpdwNumberOfBytesRead );
return isBool;
}


如果正常不HOOK 直接调用函数获取的话 可以正常显示英文的内容

    PBYTE pBuf = (PBYTE)malloc(dwMaxDataLength*sizeof(TCHAR));
DWORD dwReadDataLength = NULL;
BOOL bRet = TRUE;
do
{
ZeroMemory(pBuf,dwMaxDataLength*sizeof(TCHAR));
bRet = InternetReadFile(hInternet2,pBuf,dwMaxDataLength,&dwReadDataLength);
for (DWORD dw = 0;dw < dwReadDataLength;dw++)
{

printf("%c",pBuf[dw]);//正常显示 只是中文乱码
}
} while (NULL != dwReadDataLength);
...全文
211 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
encoderlee 2015-02-16
  • 打赏
  • 举报
回复
应该是gzip压缩问题,你自己调用WinInet发起HTTP请求头时,请求头里没有加Accept-Encoding: gzip,于是Web服务器返回的HTML即是不压缩的,所以能正常转码。而IE发起的请求默认请求头里都加了Accept-Encoding: gzip(你可以在Hook函数中调用HttpQueryInfo看看请求头是什么样的,有没有Accept-Encoding: gzip),于是Web服务器返回的数据是压缩过的,直接对压缩过的数据进行UTF8转码当然不行,得先解压数据,才能进行UTF8转码。解决办法是:1.Hook IE发起HTTP请求的相关函数,InternetOpenUrl?HttpOpenRequest ?在IE发起请求前,把请求头中的Accept-Encoding: gzip去掉。2.设置一下IE,让IE禁用Accept-Encoding: gzip(不过我看了下IE设置,好像没有这种设置)3.接受到数据后自行解压,使用第三方开源库比如zlib。 另外在HOOK函数中用HttpQueryInfo检查一下当前请求的相关信息,请求头、响应头,看看是不是对HTML的请求,而不是jpg/gif等。 另外你的Hook函数中,得先调用真实的InternetReadFile,才能读取lpBuffer的内容。

18,356

社区成员

发帖
与我相关
我的任务
社区描述
VC/MFC 网络编程
c++c语言开发语言 技术论坛(原bbs)
社区管理员
  • 网络编程
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧