字符串搜索的算法

guostong 2007-11-07 04:15:53
要找出某一个目录下包含某字符串的文件及其位置,
问题1是,文件可能很大,不能一次性的读入,然后比较,
问题2是,如果没有完全匹配还需要近似值

谢谢大家的建议
...全文
146 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
guostong 2007-11-27
  • 打赏
  • 举报
回复
非常感谢
YJ1973 2007-11-07
  • 打赏
  • 举报
回复
(方法1)直接字符串匹配,
AC,BM算法, AC算法每次只须读入一个字符并记录状态转移
BM算法每次需要读入一定量的字符数据

问题2要看你有关近似的定义,匹配达到什么程度算是近似,匹配成功部分所在字符串的位置
根据近似定义,再在匹配过程中记录相似串位置

(方法2)正则表达式匹配, 用DFA(确定有限自动机)完成
用正则表达式的形式去定义 待匹配字符串和相似

例如: 要找出hello

正则表达式为 ".*hello.*" ,相似的例如:" .*hell[a-z].*"等

33,009

社区成员

发帖
与我相关
我的任务
社区描述
数据结构与算法相关内容讨论专区
社区管理员
  • 数据结构与算法社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧