怎样实现像谷歌、百度那样的模糊搜索?

dongjunhui2010 2012-07-20 04:03:31
比如搜索“笔记本电脑”,结果中包含“笔记本电脑”“笔记本”“电脑”等等的都显示出来。
...全文
1245 16 打赏 收藏 转发到动态 举报
写回复
用AI写文章
16 条回复
切换为时间正序
请发表友善的回复…
发表回复
续写经典 2012-07-22
  • 打赏
  • 举报
回复
学习了![Quote=引用 15 楼 的回复:]

拥有一个中文词库,分词易如反掌,一点也不复杂。关键是这个词库的数据结构,它是按照散列表的方式组织的,并且按照词语联想的方式组织。只要拥有这样一个词库,将一段文字分词就非常简单了。

我以前招聘时一道机试题就是现场写一个类似分词程序。预先我们有几万个地址的经纬度坐标,然后输入任意一句不超过40个字符的文字要求迅速(通常在100毫秒之内)打印出所有地址坐标。
[/Quote]
弦弦 2012-07-21
  • 打赏
  • 举报
回复
赶紧洗洗睡吧。别做梦了。
  • 打赏
  • 举报
回复
拥有一个中文词库,分词易如反掌,一点也不复杂。关键是这个词库的数据结构,它是按照散列表的方式组织的,并且按照词语联想的方式组织。只要拥有这样一个词库,将一段文字分词就非常简单了。

我以前招聘时一道机试题就是现场写一个类似分词程序。预先我们有几万个地址的经纬度坐标,然后输入任意一句不超过40个字符的文字要求迅速(通常在100毫秒之内)打印出所有地址坐标。
  • 打赏
  • 举报
回复
[Quote=引用楼主 的回复:]
比如搜索“笔记本电脑”,结果中包含“笔记本电脑”“笔记本”“电脑”等等的都显示出来。
[/Quote]

你说的是百度式地沙拉吧唧地简单匹配吧。这就拥有一个词库,然后把文字中逐个字逐个字地匹配而找到所谓的分词结果,然后再去并行查找各个词的查询结果,最后再简单地拼起来。

如果你使用谷歌就会发现,它不是傻了吧唧地匹配分词(以至于前几页内容完全是东拉西扯互补搭界地排序),而谷歌是能够在前几页给你更加专业更加内容一致的排序结果。
rayyu1989 2012-07-21
  • 打赏
  • 举报
回复
c/s >桌控里的搜索框 http://www.370b.com
b/s >http://www.370b.com/bbsx/demo.html

上面2者 数据都是来自gg bd
whb147 2012-07-21
  • 打赏
  • 举报
回复
有分词的
很复杂的
暗尘掩月 2012-07-20
  • 打赏
  • 举报
回复
必须有词库做支撑
我就是大神 2012-07-20
  • 打赏
  • 举报
回复
分词,搜索。这么读:撸cien刀乃特。盘古分词。但是这是基本的,要想做成百度那样,呵呵~
StarlightHan 2012-07-20
  • 打赏
  • 举报
回复
http://www.baidu.com/s?ie=utf-8&bs=%3Ca%3E%E6%A0%87%E7%AD%BE%E6%B7%BB%E5%8A%A0alt&f=8&rsv_bp=1&wd=%E6%A8%A1%E7%B3%8A%E6%9F%A5%E8%AF%A2+.net&inputT=10579
楼主去这里面奋斗吧
hnfeitianwugui 2012-07-20
  • 打赏
  • 举报
回复
唉,分词,算法。。。。。
shizhu820228 2012-07-20
  • 打赏
  • 举报
回复
袄,那有点麻烦吧。。
我感觉得有关键词库吧。。
就像你说的例子,“笔记本电脑”,查询滴是,“笔记本电脑”,“笔记本”或者“电脑”
而不去查询“笔”,“记”。
而且词库还得有一定的优先级顺序。。
我只是想的。
dongjunhui2010 2012-07-20
  • 打赏
  • 举报
回复
[Quote=引用 3 楼 的回复:]
百度 自动补全
[/Quote]
我想要的不是自动完成提示。而是如何搜索。
dongjunhui2010 2012-07-20
  • 打赏
  • 举报
回复
[Quote=引用 2 楼 的回复:]
web的话,有现成的控件,叫神马忘了。
form的话,就直接去结果集或数据库里查,之后在textbox下面,加一个LISTBOX,把结果显示出来就行了吧。
[/Quote]
我想要的不是自动完成提示。而是如何搜索。
暗尘掩月 2012-07-20
  • 打赏
  • 举报
回复
百度 自动补全
shizhu820228 2012-07-20
  • 打赏
  • 举报
回复
web的话,有现成的控件,叫神马忘了。
form的话,就直接去结果集或数据库里查,之后在textbox下面,加一个LISTBOX,把结果显示出来就行了吧。
lw_881020 2012-07-20
  • 打赏
  • 举报
回复
你猜

7,765

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术 非技术区
社区管理员
  • 非技术区社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧