模糊搜索:长字符串匹配短字符串

yutou66 2005-11-09 09:25:53
输入字符串:北京人民大学
而我的数据库里面只有"人民大学"这个记录.
用模糊搜索怎么根据"北京人民大学"找到"人民大学"呀?
方法要通用的.
请大家多多讨论!
谢谢啦:)
...全文
562 19 打赏 收藏 转发到动态 举报
写回复
用AI写文章
19 条回复
切换为时间正序
请发表友善的回复…
发表回复
xuzuning 2005-12-09
  • 打赏
  • 举报
回复
分词
如按最大匹配法,则
北京人民大学 被拆分成 北京 人民大学
如按最小匹配法,则
北京人民大学 被拆分成 北京 人民 大学

中文分词是难度很高的课题,你可以看一下北京大学中文系博士研究生的课件
jyxhz 2005-12-08
  • 打赏
  • 举报
回复
客户输入的是"北京人民大学"
但我的数据库里面只有"人民大学"这个记录.
然后我怎么根据客户的输入找到"人民大学"这个记录呢?

请问楼主那“清华大学”要不要查出来呢?因为都有“大学”;又如“北京人民大会堂”要不要查出来呢?因为都有“北京人民大”;换句话说就是对匹配单元有没有限制的?
yutou66 2005-12-08
  • 打赏
  • 举报
回复
客户输入的是"北京人民大学",那么他想得到就是"北京人民大学"或"人民大学",如果把"清华大学”“北京人民大会堂”都查出来的话,那么算法就不是很好了.
谁做过搜索引擎的呀?提示一下
zdjray 2005-12-08
  • 打赏
  • 举报
回复
Select * where name like '*人民大学*'
查询语言本身就提供了的
再模糊一点的,就先拆开,再并上
zhang20084 2005-12-04
  • 打赏
  • 举报
回复
这个应该属于文本挖掘了吧
yutou66 2005-12-01
  • 打赏
  • 举报
回复
大家说说 中客网的搜索技术含量高吗?
yutou66 2005-12-01
  • 打赏
  • 举报
回复
happycock 2005-11-29
  • 打赏
  • 举报
回复
估计你应该听说各个搜索引擎在大力研制智能分词技术,或者有人抱怨google的中文分词有点弱智。
happycock 2005-11-19
  • 打赏
  • 举报
回复
简单的办法就是实现一个同义词库,复杂点的就是智能分词什么其他的东西,反正现在这东西也不怎么成熟。我想一个逐渐扩充的同义词库就差不多能胡弄过去了。
linjz2937 2005-11-19
  • 打赏
  • 举报
回复
可以用Las Vegas或Mont Calo随机算法,效率很高.
galois_godel 2005-11-19
  • 打赏
  • 举报
回复
这也叫模糊搜索,何来模糊
yutou66 2005-11-18
  • 打赏
  • 举报
回复
slwqw 2005-11-18
  • 打赏
  • 举报
回复
既然是数据库,当然不能使用自己的匹配算法了,只能使用SQL命令职工有限的支持:

Select * where name like '*人民大学*'
yutou66 2005-11-15
  • 打赏
  • 举报
回复
对,我就是想在数据库层面上实现这个功能.
请教!
happycock 2005-11-10
  • 打赏
  • 举报
回复
人家在数据库层面上操作,KMP这种底层的字符串匹配算法根本是不用自己实现的。
yutou66 2005-11-09
  • 打赏
  • 举报
回复
客户输入的是"北京人民大学"
但我的数据库里面只有"人民大学"这个记录.
然后我怎么根据客户的输入找到"人民大学"这个记录呢?

KMP算法是什么算法呀?哪里有相信的介绍呀?请教
Baku 2005-11-09
  • 打赏
  • 举报
回复
KMP算法
-----
他是长的匹配短的...

没听过这种模糊找的.....他是不是要把北京XXXX全找出来?

分词+ 过滤?要不把每个数据库的记录拿出来KMP...效率好象好低.
江南编程浪子 2005-11-09
  • 打赏
  • 举报
回复
KMP算法
Baku 2005-11-09
  • 打赏
  • 举报
回复
KMP算法是什么算法呀?哪里有相信的介绍呀?请教
-------
yun~ 随便找本数据结构的书都有的...

33,028

社区成员

发帖
与我相关
我的任务
社区描述
数据结构与算法相关内容讨论专区
社区管理员
  • 数据结构与算法社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧