昨晚通宵没睡,搞定的一个IOCP 问题,分享一下,不看的绝对会后悔!

zhouzhipen 2011-07-04 05:53:39
加精
昨晚通宵没睡,搞定了这个问题,先看一段代码(下面的代码都做了简化):

//监听线程
DWORD WINAPI CService::ClientListen(void* p)
{
while(TRUE)
{
SOCKET clientSocket=::accept(m_pInstance->m_hServiceSocket,NULL,NULL);
if(clientSocket==SOCKET_ERROR)
continue;
::CreateIoCompletionPort((HANDLE)clientSocket,m_pInstance->m_hServiceIocp,0,0);

LPIOCONTEXT pIoContext=(LPIOCONTEXT)GlobalAlloc(GPTR, sizeof( IOCONTEXT));

pIoContext->wsaBuffer.buf=pIoContext->pWorkBuffer;
pIoContext->wsaBuffer.len=10;

//下面的代码会引发非常诡异的问题,后面会讲到
UINT nRetVal =::WSARecv((SOCKET)clientSocket,&(pIoContext->wsaBuffer),1,&(pIoContext->dwIoSize),&(pIoContext->dwlFlags),&(pIoContext->overlapped), NULL);/*关键位置A*/
}
return 0;
}


上面的这段代码看上去没什么问题,但事实上会引发服务崩溃。接着看:

//完成处理线程
DWORD WINAPI CService::DoService(void* p)
{
DWORD dwBytesXfered=0;
DWORD dwKey=0;
LPIOCONTEXT pIoContext=NULL;
while(TRUE)
{
GetQueuedCompletionStatus(m_pInstance->m_ServiceIocp,&dwBytesXfered,&dwKey,(LPOVERLAPPED*)(&pIoContext),INFINITE);
GlobalFree(pIoContext);/*位置B*/
}
return 0;
}


上面这段代码看上去也没有问题(其实也确实没问题),但死了我无数的脑细胞。

问题描述:
服务器在接受几个连接之后,要么无故退出,要么就是程序出错Windows要关闭它。
通过调试器运行,提示堆破坏,难道有使用了已释放的内存?检查了3个小时,没找出有可能出现内存错误的地方。
后来实在没办法了,把所有的分配内存的地方地改成GlobalAlloc与GlobalFree,但问题仍旧存在。
最后,干脆把所有的内存释放的地方全去掉,然后逐个调试(加上一个,运行一遍),看看到底是哪个内存出错了,昨晚大部会时间花在这上面了(调试堆破坏我只有这一个办法,不知道高手有其它方法没有?望赐教!)。
最后定位到上面的B处 GlobalFree。

但究竟是什么原因造成的呢?
在网上也找不出所以然,最后几乎快要放弃了,但偶然间改了A处的两个地方,服务器安全运行了(激动啊)!!
改变如下:
UINT nRetVal =::WSARecv((SOCKET)clientSocket,&(pIoContext->wsaBuffer),1,&(pIoContext->dwIoSize),&(pIoContext->dwlFlags),&(pIoContext->overlapped), NULL);
变为
DWORD dwRecvbytes=0;
DWORD dwlFlags=0;
UINT nRetVal =::WSARecv((SOCKET)clientSocket,&(pIoContext->wsaBuffer),1,&dwIoSize,&dwlFlags,&(pIoContext->overlapped), NULL);

也就是说,把WSARecv 第4、第5个参数改成使用局部变量。

现在问题是解决了,但具体原因还只是猜测:
如果不使用局部变量作为参数,那么在IO 等待中系统将会一直引用这两个变量,就算是一个IO完成了,系统内部仍然在使用所以当释放内存后,系统再次使用变量时就破坏了堆数据。


上面的废话比较多,希望大家能看懂,同时也希望看明白的说说自己的看法。做服务器我是新手,希望高手多多指点!
...全文
6130 209 打赏 收藏 转发到动态 举报
写回复
用AI写文章
209 条回复
切换为时间正序
请发表友善的回复…
发表回复
饭怕稀 2012-08-21
  • 打赏
  • 举报
回复
学习学习
vincent2600 2012-08-16
  • 打赏
  • 举报
回复
iocp不熟
shuot 2012-02-06
  • 打赏
  • 举报
回复
WRecv函数里面需要往那个地方写入返回值。
你把他在另一个线程里面释放了,不挂就奇怪了。
yibalaodao1 2011-08-11
  • 打赏
  • 举报
回复
为什么不用boost::asio
bmwdoc 2011-08-10
  • 打赏
  • 举报
回复
四个中文字
Im17benteng 2011-08-03
  • 打赏
  • 举报
回复
楼主这个地方应该使用acceptex,还有在传入参数前把这两变量的值征新初始化一次就解决问题了
你把变量地址传进去了,值是要改变的
雨夜枫林 2011-07-22
  • 打赏
  • 举报
回复
[Quote=引用 74 楼 sxqinge 的回复:]

学海无涯,我表示很白菜,学习下
[/Quote]
同是顶贴者。。。。。。。。。。
大风扯 2011-07-15
  • 打赏
  • 举报
回复
顶下,好东西呀 呵呵俄
barbarian110 2011-07-15
  • 打赏
  • 举报
回复
Mark!
帝国队长 2011-07-14
  • 打赏
  • 举报
回复
顶,不错~~~
zhouzhipen 2011-07-14
  • 打赏
  • 举报
回复
看了大家的意见,又反复做了几天试验,结果还是觉得问题是出在变量问题上。
我喝多了 2011-07-14
  • 打赏
  • 举报
回复

BOOL CClient::Recv()
{
DWORD flags=0;
DWORD recvBytes=0;
ZeroMemory(&m_IO,sizeof(IO_OPERATION_DATA));
m_IO.type=READ;

if(WSARecv(m_s,&m_IO.dataBuf,1,&recvBytes,&flags,&m_IO.overlapped,NULL)==SOCKET_ERROR)
{
if(ERROR_IO_PENDING!=WSAGetLastError())
{
return FALSE;
}
}
return TRUE;
}
我喝多了 2011-07-14
  • 打赏
  • 举报
回复
学习来了,这个问题是隐含错误,不容易发现。孙海民的书上也是用的局部变量
流星齐 2011-07-13
  • 打赏
  • 举报
回复
路过接分
野男孩 2011-07-13
  • 打赏
  • 举报
回复
WSARecv是异步调用,这条语句结束后,while循环从头开始,此时,之前的局部变量地址可能被复用。

所以WSARecv里面的参数地址用局部变量地址,应该不是正确的做法。


有时候,程序不出错,不表示没有问题。

lz不妨把出错的完整工程贴出来,大家都调试一下看看,到底是啥问题。
wangchao_815 2011-07-13
  • 打赏
  • 举报
回复
好贴要顶 mar在看
白发悲花落 2011-07-11
  • 打赏
  • 举报
回复
楼主强大,小弟表示看不懂
qq1077483 2011-07-09
  • 打赏
  • 举报
回复
看不懂啊。学习了。
vampire0 2011-07-09
  • 打赏
  • 举报
回复
我的服务器也有类似的问题,但是服务器不太一样。。不过对我还是有点用的感觉
kingmax54212008 2011-07-09
  • 打赏
  • 举报
回复
mark~~~
加载更多回复(179)

18,356

社区成员

发帖
与我相关
我的任务
社区描述
VC/MFC 网络编程
c++c语言开发语言 技术论坛(原bbs)
社区管理员
  • 网络编程
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧