社区
数据结构与算法
帖子详情
模糊搜索:长字符串匹配短字符串
yutou66
2005-11-09 09:25:53
输入字符串:北京人民大学
而我的数据库里面只有"人民大学"这个记录.
用模糊搜索怎么根据"北京人民大学"找到"人民大学"呀?
方法要通用的.
请大家多多讨论!
谢谢啦:)
...全文
555
19
打赏
收藏
模糊搜索:长字符串匹配短字符串
输入字符串:北京人民大学 而我的数据库里面只有"人民大学"这个记录. 用模糊搜索怎么根据"北京人民大学"找到"人民大学"呀? 方法要通用的. 请大家多多讨论! 谢谢啦:)
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
19 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
xuzuning
2005-12-09
打赏
举报
回复
分词
如按最大匹配法,则
北京人民大学 被拆分成 北京 人民大学
如按最小匹配法,则
北京人民大学 被拆分成 北京 人民 大学
中文分词是难度很高的课题,你可以看一下北京大学中文系博士研究生的课件
jyxhz
2005-12-08
打赏
举报
回复
客户输入的是"北京人民大学"
但我的数据库里面只有"人民大学"这个记录.
然后我怎么根据客户的输入找到"人民大学"这个记录呢?
请问楼主那“清华大学”要不要查出来呢?因为都有“大学”;又如“北京人民大会堂”要不要查出来呢?因为都有“北京人民大”;换句话说就是对匹配单元有没有限制的?
yutou66
2005-12-08
打赏
举报
回复
客户输入的是"北京人民大学",那么他想得到就是"北京人民大学"或"人民大学",如果把"清华大学”“北京人民大会堂”都查出来的话,那么算法就不是很好了.
谁做过搜索引擎的呀?提示一下
zdjray
2005-12-08
打赏
举报
回复
Select * where name like '*人民大学*'
查询语言本身就提供了的
再模糊一点的,就先拆开,再并上
zhang20084
2005-12-04
打赏
举报
回复
这个应该属于文本挖掘了吧
yutou66
2005-12-01
打赏
举报
回复
大家说说 中客网的搜索技术含量高吗?
yutou66
2005-12-01
打赏
举报
回复
顶
happycock
2005-11-29
打赏
举报
回复
估计你应该听说各个搜索引擎在大力研制智能分词技术,或者有人抱怨google的中文分词有点弱智。
happycock
2005-11-19
打赏
举报
回复
简单的办法就是实现一个同义词库,复杂点的就是智能分词什么其他的东西,反正现在这东西也不怎么成熟。我想一个逐渐扩充的同义词库就差不多能胡弄过去了。
linjz2937
2005-11-19
打赏
举报
回复
可以用Las Vegas或Mont Calo随机算法,效率很高.
galois_godel
2005-11-19
打赏
举报
回复
这也叫模糊搜索,何来模糊
yutou66
2005-11-18
打赏
举报
回复
顶
slwqw
2005-11-18
打赏
举报
回复
既然是数据库,当然不能使用自己的匹配算法了,只能使用SQL命令职工有限的支持:
Select * where name like '*人民大学*'
yutou66
2005-11-15
打赏
举报
回复
对,我就是想在数据库层面上实现这个功能.
请教!
happycock
2005-11-10
打赏
举报
回复
人家在数据库层面上操作,KMP这种底层的字符串匹配算法根本是不用自己实现的。
yutou66
2005-11-09
打赏
举报
回复
客户输入的是"北京人民大学"
但我的数据库里面只有"人民大学"这个记录.
然后我怎么根据客户的输入找到"人民大学"这个记录呢?
KMP算法是什么算法呀?哪里有相信的介绍呀?请教
Baku
2005-11-09
打赏
举报
回复
KMP算法
-----
他是长的匹配短的...
没听过这种模糊找的.....他是不是要把北京XXXX全找出来?
分词+ 过滤?要不把每个数据库的记录拿出来KMP...效率好象好低.
江南编程浪子
2005-11-09
打赏
举报
回复
KMP算法
Baku
2005-11-09
打赏
举报
回复
KMP算法是什么算法呀?哪里有相信的介绍呀?请教
-------
yun~ 随便找本数据结构的书都有的...
PDF电子书《柔性
字符串
匹配
》
PDF电子书《柔性
字符串
匹配
》,和大家分享~
FuzzyWuzzy:Python中的模糊
字符串
匹配
什么是模糊
字符串
匹配
? 模糊
字符串
匹配
是大致(而不是精确地)查找与给定模糊匹配的
字符串
的过程,就像字面意思一样,它也被称为近似
字符串
匹配
。通常,这些
字符串
普哦诶的模式另一个
字符串
。 使用Levenshtein Distance计算两个
字符串
之间的接近程度,也称为编辑距离,其基本上是基于将一个
字符串
转换为另一个
字符串
的精确匹配所需要的基本操作的计数。 Fuzzy(模糊)
字符串
匹配
像一个老板。它...
Python Fuzzywuzzy库:模糊
字符串
匹配
的利器
fuzz.ratioPython的fuzzywuzzy库为
字符串
匹配
提供了强大的工具,通过基于Levenshtein距离的算法,它在处理拼写错误、同义词、词序不同等情况时展现出色的表现。在本文中,深入了解了库中的关键函数,包括fuzz.ratio和。fuzz.ratio简单而直观,适用于基本的
字符串
相似性比较,尤其在拼写检查中表现出色。而允许部分
字符串
匹配
,适用于
模糊搜索
,处理用户输入可能是目标
字符串
的一部分的情况。和则考虑了
字符串
中单词的排序和集合,分别适用于处理同义词和词序不同的场景。
推荐文章:模糊
字符串
匹配
利器 —— fuzzy-string-match
推荐文章:模糊
字符串
匹配
利器 —— fuzzy-string-match 在数据处理和搜索领域,精确的
字符串
匹配
固然重要,但在现实应用中,我们往往需要一种更灵活的方式,来处理拼写错误或轻微变异的文本匹配。今天,我们要介绍的这款名为fuzzy-string-match的开源库,正是为了解决这一问题而生。它专为Ruby设计,以其高效的性能和专注的算法,让
字符串
比较变得既准确又高效。 项目介绍 fuzz...
fuzzy-string-match: 快速、高效的模糊
字符串
匹配
算法实现
fuzzy-string-match: 快速、高效的模糊
字符串
匹配
算法实现 项目地址: 模糊
字符串
匹配
是一种用于寻找两个
字符串
之间的相似度的方法。在许多应用场景中,如搜索引擎、代码补全、自动纠错等,都需要利用这种技术来提高用户体验。本文将向您介绍一个名为 fuzzy-string-match 的高效模糊
字符串
匹配
算法实现。 1. 项目简介 fuzzy-string-match 是一个简单的 P...
数据结构与算法
33,028
社区成员
35,337
社区内容
发帖
与我相关
我的任务
数据结构与算法
数据结构与算法相关内容讨论专区
复制链接
扫一扫
分享
社区描述
数据结构与算法相关内容讨论专区
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章