模糊匹配算法,还请高手指点。。。。

shan0yu 2007-07-10 10:49:12
现在我有个词库,可能包含:"我的程序员","csdn.net"。

“我的程序员”与传入字符串——“我爱我的程序员网站”,“他是我的程序园目标”模糊匹配,要求有百分之80以上相同,就认为匹配成功。要求与传入的两个均能匹配成功。

要求“csdn.net”与传入字符串——“www.csdn.net”,“csdn.ne” 匹配均能成功。

传入的字符串长短不定,

请大家给介绍种算法~~非常感谢~
...全文
740 7 打赏 收藏 转发到动态 举报
写回复
用AI写文章
7 条回复
切换为时间正序
请发表友善的回复…
发表回复
zapdos 2007-07-14
  • 打赏
  • 举报
回复
中文应该像百度那样,设置一个词库,进行正向最大匹配
英文模糊匹配类似
rainv 2007-07-14
  • 打赏
  • 举报
回复
帮顶
mimanginging 2007-07-13
  • 打赏
  • 举报
回复
学习下~
shan0yu 2007-07-13
  • 打赏
  • 举报
回复
有点迷糊
jihanzhong 2007-07-11
  • 打赏
  • 举报
回复
没做过这个,自己随便想了个,提出来交流

1:从匹配字符串中 按照匹配深度取出最小匹配 字符串。
比如匹配字符串100个字符,深度80%,那么最小匹配字符串就是中间60个字符,原理自己想
字符小的时候有取整舌入问题。
另外需要记下差额匹配字符数(例子里是20个)。

2:在被匹配字符串中按最小匹配 字符串进行匹配。

3:检查每个匹配点,往前和往后统计差额匹配的字符数,超过1中的差额匹配字符数,则记为匹配成功。


TomyGuan 2007-07-11
  • 打赏
  • 举报
回复
這個需要分詞處理。
建義用lucene來處理。
shan0yu 2007-07-11
  • 打赏
  • 举报
回复
顶一顶

62,623

社区成员

发帖
与我相关
我的任务
社区描述
Java 2 Standard Edition
社区管理员
  • Java SE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧