汉字,模糊搜索的问题

fmbws 2010-09-11 09:57:07
用一个网上找到的代码,不过有问题,比如在 用“北”搜索,可以找到“北京”,但如果用“京”,就找不到北京,哪位大侠帮忙看看

BOOL IsBlur(BYTE c1,BYTE c2,char c)
{ //模糊匹配函数,判断字母c是否为汉字(c1c2)的声母。
//(一个汉字由两个字节构成,且每个字节的最高位即左边第一位为1)

//汉字声母区间表:
static unsigned char cEnd[23*5+1] = "啊澳a芭怖b擦错c搭堕d蛾贰e发咐f噶过g哈紕h肌骏j喀阔k垃络l妈那m娜诺n哦沤o啪瀑p期群q然弱r撒所s塌唾t挖误w昔迅x压孕y匝座z";
static int nWord[23][2] = {0};
int i=0;
if(nWord[0][0] == 0)
{//初始化nWord
for(i = 0;i < 23; i++)
{
nWord[i][0] = cEnd[i*5]*256 + cEnd[i*5+1];
nWord[i][1] = cEnd[i*5+2]*256 + cEnd[i*5+3];
}
}
int nWordChinese = c1 * 256 + c2;
int nLeft = 0,nRight = 22;
BOOL bMatch = FALSE;
while(nLeft <= nRight)
{
i = (nLeft + nRight)/2;
if(nWordChinese > nWord[i][1])
nLeft = i+1;
else if(nWordChinese < nWord[i][0])
nRight = i-1;
else
{
if(cEnd[i*5+4] == c)
bMatch = TRUE;
break;
}
}
return bMatch;
}
BOOL BlurFindStr(CString &strSource,CString &strFindCell)
{//模糊搜索,支持用汉字用声母查询,返回
int nLenCell = strFindCell.GetLength();
int nLenSource = strSource.GetLength();
if(nLenCell < 1)
return TRUE;
if(nLenSource <1)
return FALSE;
strSource.MakeLower();
strFindCell.MakeLower();
BOOL bContainChar = FALSE;
int i,j,k;
for(i=0; i< nLenCell; i++)
{
if( !(strFindCell.GetAt(i)&0x80) ) //1<<7
{//不是汉字,需要进行模糊查询
bContainChar = TRUE;
break;
}
}
j = 0;
int nMatchCharCount = 0;
BOOL bEqual = FALSE;
int ik;
for(i = 0; i< nLenCell && j < nLenSource; i++)
{
ik = i;
char c = strFindCell.GetAt(i);
if(c&0x80)//汉字
{
i++;
while(j < nLenSource)
{
char cs = strSource.GetAt(j++);
k = j;
if(cs&0x80)//汉字
j++;
if(cs == c &&
k < nLenSource && strSource.GetAt(k) == strFindCell.GetAt(i))
{
if(ik == 0)
bEqual = TRUE;
nMatchCharCount += 2;
break;
}
else if(i > 0)
{
bEqual = FALSE;
nMatchCharCount = 0;
i = 0;
break;
}
}
}
else//字母
{
while(j < nLenSource)
{
char cs = strSource.GetAt(j++);
k = j;
if(cs&0x80)//汉字
{
j++;
if(IsBlur(cs,strSource.GetAt(k),c))
{
if(ik == 0)
bEqual = TRUE;
nMatchCharCount++;
break;
}
else if(i > 0)
{
bEqual = FALSE;
nMatchCharCount = 0;
i = 0;
break;
}
}
else if(cs == c)
{
if(ik == 0)
bEqual = TRUE;
nMatchCharCount++;
break;
}
else if(i > 0)
{
bEqual = FALSE;
nMatchCharCount = 0;
i = 0;
break;
}
}
}
}
if(bEqual && i == nLenCell && j == nLenSource)
{
return TRUE+TRUE;
}
else
{
return (nMatchCharCount == nLenCell);
}
};

...全文
79 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
lazy_2010 2010-09-11
  • 打赏
  • 举报
回复
自己用动态规划实现一个吧,又不是很复杂
xengine-qyt 2010-09-11
  • 打赏
  • 举报
回复
绑定,只知道 文本查找!

16,472

社区成员

发帖
与我相关
我的任务
社区描述
VC/MFC相关问题讨论
社区管理员
  • 基础类社区
  • Web++
  • encoderlee
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

        VC/MFC社区版块或许是CSDN最“古老”的版块了,记忆之中,与CSDN的年龄几乎差不多。随着时间的推移,MFC技术渐渐的偏离了开发主流,若干年之后的今天,当我们面对着微软的这个经典之笔,内心充满着敬意,那些曾经的记忆,可以说代表着二十年前曾经的辉煌……
        向经典致敬,或许是老一代程序员内心里面难以释怀的感受。互联网大行其道的今天,我们期待着MFC技术能够恢复其曾经的辉煌,或许这个期待会永远成为一种“梦想”,或许一切皆有可能……
        我们希望这个版块可以很好的适配Web时代,期待更好的互联网技术能够使得MFC技术框架得以重现活力,……

试试用AI创作助手写篇文章吧