高手请进 linux下信号量同步多线程问题

yin138 2011-09-24 11:04:15
我在编写一个正则表达式匹配多线程库
使用信息量来同步工作线程(匹配线程)并等待处理结果,该程序在测试环境下没有问题,但在我的主程序中出现了问题。
我使用两个信号灯的信号量集,一个用于表示当前可用任务数(为实开工作线程数),一个用于表示当前已经完成的任务数。
程序流量如下:
《主线程》
建立任务数据缓冲区,给所有线程返回
设置已经完成任务信号灯为0,可用任务数信号灯为工作线程数
主线程完成自己的一份,并等待其它工作线程返回
完成任务,并释放缓冲(该处出现读已经FREE的数据

《工作线程》
等待任务信号量,并取得一个信号资源
工作……
释放任务完成信号量

问题:
该库在测试环境下工作良好,主线程,即为工作(main)主线程。
工作环境,在DLL中,由辅助线程调用,出现段错误问题
使用valgrind检查发现测试环境没有问题,工作环境出现访问free数据。

以下为工作环境调试信息
[DEBUG] 2011-09-24 10:16:08.533 pcre matcher finished work, 244980032 subject:bfd4288, len:172
[DEBUG] 2011-09-24 10:16:08.548 all matcher has finished work.
[DEBUG] 2011-09-24 10:16:08.552 pcre matcher finish release signal...(244980032)
[DEBUG] 2011-09-24 10:16:08.553 pcre matcher wait to work...(244980032)
-----[DEBUG] 2011-09-24 10:16:08.595 pcre matcher finished work, 244980032 subject:bfd4288, len:172
-----[DEBUG] 2011-09-24 10:16:08.596 pcre matcher finish release signal...(244980032)

[DEBUG] 2011-09-24 10:16:08.600 pcre matcher wait to work...(244980032)
红色部分为工作线程多次访问,第二次访问的时候,资源已经释放……就出现问题了

/**
* match a subject using PCRE
* return 0 - success, -1 -- failed
*/
int pcre_match(pcre_obj_t* _this, char* subject,
unsigned int subject_len, void** pptag)
{
int result;
if (_this->threads_count > 1){
pthread_rwlock_rdlock(&_this->rwlock);
}
*pptag = NULL;
/*build subject buff include end 0*/
char* sharesubject;
sharesubject = (char*)malloc(subject_len + 2);
if (sharesubject == NULL) goto clean;
memcpy(sharesubject, subject, subject_len);
sharesubject[subject_len] = '\0';
sharesubject[subject_len+1] = '\0';
/*do match using matcher*/
if (_this->threads_count > 1){
/*enable all thread to work*/
int threadcnt = set_running_thread_match_param(_this->matcher_list,
sharesubject, subject_len, pptag);
threadcnt--; /* reduce main thread's share */
msg_log_debug("let all matcher to work for master, subject address:%x, len%d.", sharesubject, subject_len);
do{
result = semset_set(_this->semid, TASK_FINISH_SEM_IDX, 0);
}while(result == -1 && (errno == EAGAIN || errno == EINTR));
if (result == -1 && !(errno == EAGAIN || errno == EINTR)){
msg_log_warn("Unexpected error on set signal[%d].", errno);
}
do{
result = semset_set(_this->semid, TASK_START_SEMIDX, threadcnt);
}while(result == -1 && (errno == EAGAIN || errno == EINTR));
if (result == -1 && !(errno == EAGAIN || errno == EINTR)){
msg_log_warn("Unexpected error on set signal[%d].", errno);
}
/* do main thread's share */
_this->matcher_list->match_result = pcre_match_item(
_this->matcher_list->pattern_list,
_this->matcher_list->subject,
_this->matcher_list->subject_len,
_this->matcher_list->pptag);
/* wait all threads to finish their share */
msg_log_debug("wait all work matcher threads finish single...");
do{
semset_wait(_this->semid, TASK_FINISH_SEM_IDX, 1, threadcnt);
}while(result == -1 && (errno == EAGAIN || errno == EINTR));
if (result == -1 && !(errno == EAGAIN || errno == EINTR)){
msg_log_warn("Unexpected error on set signal[%d].", errno);
}
msg_log_debug("all matcher has finished work.");
result = get_match_result(_this->matcher_list, pptag);
}else{
result = pcre_match_item(_this->matcher_list->pattern_list,
sharesubject, subject_len, pptag);
}
clean:
if (_this->threads_count > 1){
pthread_rwlock_unlock(&_this->rwlock);
}
if (sharesubject != NULL) free(sharesubject);

return result;
}


请求各位给个思路,项目很紧,先行谢过!
...全文
397 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
yin138 2011-10-21
  • 打赏
  • 举报
回复
看来本问题已经没人可以回答了,经过早几天的探索,将问题解决了,而我这个问题的原因也不确定。
估计是使用SystemV信号量的set函数的问题,该函数可能存在一些特殊的非原子性问题,在使用信号量时一般只要初始化一次,初始化多次是可能有问题的。

经过我的探索,我自己明白了一个道理,那就是“信号量其实是一个可以让进程等待在该数值上等待的量,仅是一个量”,为什么这说理解呢?因为原来总认为信号量相当于资源,目前很多书上也这么说,我就认为信号量应该在设定之后是不变的,然后其它进程可以来竞争访问。其它,信号量作为资源来使用,保是信号量的特殊符合这人使用语义,而且也得到了广泛应用,而且同步原语应该也是在这个基础上建立起来的。如果能将信号量看成一个值,那问题就好解决了,也容易理解了。
我有资源,我就给信号量值,需要资源就从信号量去取,并不需要保证分配资源一定需要收回资源。只要保证资源分配了,有人取走了就OK了,不然信号量会溢出,或者死等。

所以我解决该问题的方法就是:
前面已经说了我的意图:想实现多个线程来并行处理我的关键字匹配(每个系统分配一部分关键字),主线程需要通知所有关键字匹配进程,还需要从线程取得结果,原来我的方法是使用两个信号量,一个信号量相当于分配资源,一个用于等待完成。其它这个问题的解决思路是:一个等待完成信号量,N个用于工作线程(匹配线程)的信号量,主线程只是有任务时分配资源,工作线程只取资源,双方都只是利用信号量实现等待,不实现资源语义,工作线程完成工作后,给完成信号量一个资源,主线程等待信号量达到要求,再将信号量置0(取得所有资源),这样一来就完成了多线程的并行任务。

希望我的方法可以给遇到同样问题的人有点帮助。结贴了。
yin138 2011-09-26
  • 打赏
  • 举报
回复
TO: zhao4zhong1
你好,其实你的代码是有问题的,我写了一个类似的日志处理类,比这稍复杂一些,也使用了mutex进行锁定,有时在多线程的情况下会出现死锁,具体原因我现在也不知道,但我知道产生的原因是:
localtime,因为linux下该函数有自己的锁,如果在localtime处产生中断,并再重入日志函数,将产生死锁。

这里有两个地方,想跟各位有幸光临的高手请教一下:
1、多线程读我一份subject(关键字匹配对象),是不是需要同步,按理只读是不需要同步的;
2、使用信号量,每次使用set去初始化是不是不正确,或者不应该这样处理?
赵4老师 2011-09-26
  • 打赏
  • 举报
回复
仅供参考
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#ifdef WIN32
#include <windows.h>
#include <io.h>
#else
#include <unistd.h>
#include <sys/time.h>
#include <pthread.h>
#define CRITICAL_SECTION pthread_mutex_t
#define _vsnprintf vsnprintf
#endif
//Log{
#define MAXLOGSIZE 100000000
#define ARRSIZE(x) (sizeof(x)/sizeof(x[0]))
#include <time.h>
#include <stdarg.h>
char logfilename1[]="MyLog1.log";
char logfilename2[]="MyLog2.log";
char logstr[16000];
char datestr[16];
char timestr[16];
char ms10[3];
CRITICAL_SECTION cs_log;
FILE *flog;
int centisec() {
#ifdef WIN32
return ((GetTickCount()%1000L)/10)%100;
#else
struct timeval tv;

if (!gettimeofday(&tv,NULL)) {
return ((tv.tv_usec%1000000L)/10000)%100;
} else {
return 0;
}
#endif
}
#ifdef WIN32
void Lock(CRITICAL_SECTION *l) {
EnterCriticalSection(l);
}
void Unlock(CRITICAL_SECTION *l) {
LeaveCriticalSection(l);
}
#else
void Lock(CRITICAL_SECTION *l) {
pthread_mutex_lock(l);
}
void Unlock(CRITICAL_SECTION *l) {
pthread_mutex_unlock(l);
}
#endif
void LogV(const char *pszFmt,va_list argp) {
struct tm *now;
time_t aclock;


if (NULL==pszFmt||0==pszFmt[0]) return;
if (-1==_vsnprintf(logstr,ARRSIZE(logstr),pszFmt,argp)) logstr[ARRSIZE(logstr)-1]=0;
time(&aclock);
now=localtime(&aclock);
sprintf(datestr,"%04d-%02d-%02d",now->tm_year+1900,now->tm_mon+1,now->tm_mday);
sprintf(timestr,"%02d:%02d:%02d",now->tm_hour ,now->tm_min ,now->tm_sec );
sprintf(ms10,"%02d",centisec());
printf("%s %s.%s %s",datestr,timestr,ms10,logstr);
flog=fopen(logfilename1,"a");
if (NULL!=flog) {
fprintf(flog,"%s %s.%s %s",datestr,timestr,ms10,logstr);
if (ftell(flog)>MAXLOGSIZE) {
fclose(flog);
if (rename(logfilename1,logfilename2)) {
remove(logfilename2);
rename(logfilename1,logfilename2);
}
flog=fopen(logfilename1,"a");
if (NULL==flog) return;
}
fclose(flog);
}
}
void Log(const char *pszFmt,...) {
va_list argp;

Lock(&cs_log);
va_start(argp,pszFmt);
LogV(pszFmt,argp);
va_end(argp);
Unlock(&cs_log);
}
//Log}
int main(int argc,char * argv[]) {
int i;
#ifdef WIN32
InitializeCriticalSection(&cs_log);
#else
pthread_mutex_init(&cs_log,NULL);
#endif
for (i=0;i<10000;i++) {
Log("This is a Log %04d from FILE:%s LINE:%d\n",i, __FILE__, __LINE__);
}
#ifdef WIN32
DeleteCriticalSection(&cs_log);
#else
pthread_mutex_destroy(&cs_log);
#endif
return 0;
}
luciferisnotsatan 2011-09-26
  • 打赏
  • 举报
回复
帮顶个
yin138 2011-09-24
  • 打赏
  • 举报
回复
自己先项一个,期待高手

24,854

社区成员

发帖
与我相关
我的任务
社区描述
C/C++ 工具平台和程序库
社区管理员
  • 工具平台和程序库社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧