请问大家在字符串查找方面有什么高见？

creativitysoft 2003-10-17 01:19:57

请问大家在字符串查找方面有什么高见？

有没有比较快的代码？谢谢！

...全文

50 9 打赏收藏转发到动态举报

写回复

用AI写文章

9 条回复

切换为时间正序

请发表友善的回复…

发表回复

yjy1001 2003-10-17

打赏
举报

直接使用现成的函数strstr
可满足一般用户的查找字符串功能
但要追求除了效率外还是效率的程序
那么只有用数据结构的知识自己写函数来实现了

jiangchun_xn(【GrayMemory】) 转的帖写得很好同意其实现方法

jiangchun_xn 2003-10-17

打赏
举报

fatwave(风中的雨)：你如果作防火墙，你就知道一个快速的匹配算法的重要行了。

fatwave 2003-10-17

打赏
举报

现在计算机速度很快用循环就可以了！！

我不懂电脑 2003-10-17

打赏
举报

直接使用现成的函数strstr

jiangchun_xn 2003-10-17

打赏
举报

KMP算法再数据结构里就学过，应该会把，上面是另外的转载，改进的bm算法

jiangchun_xn 2003-10-17

打赏
举报

字符串搜索算法中，最著名的两个是KMP算法（Knuth-Morris-Pratt)和BM算法（Boyer-Moore)。两个算法在最坏情况下均具有线性的搜索时间。但是在实用上，KMP算法并不比最简单的c库函数strstr()快多少，而BM算法则往往比KMP算法快上3－5倍。但是BM算法还不是最快的算法，还有很多改进的BM算法存在，比如Boyer-Moore-Horspool算法。
经过研究发现，Boyer-Moore-Horspool也存在可以改进的地方。例如我们要在"substring searching algorithm"搜索"search"，刚开始时，把子串与文本左边对齐，
substring searching algorithm
search^
第一次匹配结果是在第二个字符处发现不匹配，于是要把子串往后移动。但是该移动多少呢？这就是各种算法各显神通的地方了，最简单的做法是移动一个字符位置；KMP是利用已经匹配部分的信息来移动；BM算法是做反向比较，并根据已经匹配的部分来确定移动量。Boyer-Moore-Horspool算法根据被比较串对齐的最后一个字符（“r”）来决定位移量的多少。
我们的方法是根据紧跟在当前子串之后的那个字符（上图中的“i”)获得位移量。
显然，由于上一次匹配的失败，移动是必然的，因此，设移动步数为N,则N>＝1。但N的最大值是多少了？如果这个字符在模式串中，显然应该根据模式串的位置来决定。如果它在模式串中就没有出现，显然连他自己也不用比较量，因此可以移动到该字符地下一个字符开始比较。
以上面的例子，子串“search”中并不存在“i”，则说明可以直接跳过一大片，从“i”之后的那个字符开始作下一步的比较，如下：
substring searching algorithm
search^
比较的结果，第一个字符又不匹配，再看子串后面的那个字符，是“r”,它在子串中出现在倒数第三位，于是把子串向前移动三位，使两个“r”对齐，如下：
substring searching algorithm
search
这次匹配成功了！回顾整个过程，我们只移动了两次子串就找到了匹配位置，可以看出，用这个算法，每一步的移动量都比BMH算法要大，所以肯定比BM算法更快。
以下是用类封装的搜索算法：
class Search {
static const int MAXCHAR = 256;
int d[MAXCHAR];
int m;
char* patt;
public:
Search(char*,m);
int find(char*,);
};
Search::Search(char* p,len)
{
assert(p);
patt = p;
m = len;
int k = 0;
for (k = 0; k < MAXCHAR; k++)
d[k] = m+1;
for (k = 0; k < m - 1; k++)
d[patt[k]] = m - k ;
}
int Search::find(char* text,len)
{
assert(text);
int n = len;
if (m > n)
return -1;

int k = m - 1;
while (k < n) {
int j = m - 1;
int i = k;
while (j >= 0 && text == patt[j]) {
j--;
i--;
}
if (j == -1)
return i + 1;
k += d[text[k+1]];
}
return -1;
}

huangjuliang 2003-10-17