研究搜索引擎的高手和lucene的高手 请进 立刻给分

super_qingchao 2006-04-01 11:51:52
研究搜索引擎的高手和lucene的高手 请进 立刻给分

LUCENE进行全文搜索,搜索结果生成全文所略,可是生成的所略内容太多如何才能取,其中关键字出现频率最高的50个字。类似GOOGLE或百度那样。。。
...全文
358 15 打赏 收藏 转发到动态 举报
写回复
用AI写文章
15 条回复
切换为时间正序
请发表友善的回复…
发表回复
cuij7718 2006-04-21
  • 打赏
  • 举报
回复
其实可以自己做索引来解决这个问题,
http://www.blogjava.net/sunfruit/archive/2006/04/05/39276.html

自己做索引可以可以根据字索引的大小获得排序结果
treeroot 2006-04-21
  • 打赏
  • 举报
回复
关注
li_guang 2006-04-21
  • 打赏
  • 举报
回复
先得到他的位置,再算出位置的方差
glorymusic 2006-04-21
  • 打赏
  • 举报
回复
lucene默认就是按相关度排序的. 但是百度和Google并不是单纯按相关度排序, 百度有超链分析,Google有PageRank
xingchen0yuxi 2006-04-21
  • 打赏
  • 举报
回复
感兴趣...,先帮顶!
netsummer123 2006-04-20
  • 打赏
  • 举报
回复
up
phckt 2006-04-20
  • 打赏
  • 举报
回复
lucene默认就是按相关度排序的. 但是百度和Google并不是单纯按相关度排序, 百度有超链分析,Google有PageRank
fool_leave 2006-04-20
  • 打赏
  • 举报
回复
I suppose you can get them in highlighting job.
Store all the text in the document's field.And use Highlighter.getBestFragment() to get what you want.
Remember calling Highlighter.setTextFragmenter(new SimpleFragmenter(50)) first,it would restrict the return words' length into 50.
yuzl32 2006-04-02
  • 打赏
  • 举报
回复
感兴趣...,先帮顶!
aywrenyue 2006-04-02
  • 打赏
  • 举报
回复
lucene车东的博客上有讲,你可以看一下
还不是很了解
帮顶,等待答案
chg2008 2006-04-02
  • 打赏
  • 举报
回复
偶也在关注这个,还没到这个深度
jobs002 2006-04-02
  • 打赏
  • 举报
回复
关注一下........
Wathking 2006-04-02
  • 打赏
  • 举报
回复
了解,先顶着...
welfarefanwei 2006-04-02
  • 打赏
  • 举报
回复
还没有研究那么深。
不过想知道更多一点
super_qingchao 2006-04-02
  • 打赏
  • 举报
回复
继续

62,629

社区成员

发帖
与我相关
我的任务
社区描述
Java 2 Standard Edition
社区管理员
  • Java SE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧