社区
Java EE
帖子详情
Lucene 过滤器 如何过滤得分较低的文档。
哈哈牛人
2011-11-08 05:53:24
如题: 在查询一个索引库的使用,如何过滤掉得分低于某一个值的文档呢?
这个过滤器要怎么写呢?
求大神帮忙!
...全文
60
1
打赏
收藏
Lucene 过滤器 如何过滤得分较低的文档。
如题: 在查询一个索引库的使用,如何过滤掉得分低于某一个值的文档呢? 这个过滤器要怎么写呢? 求大神帮忙!
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
1 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
24K純帥
2011-11-08
打赏
举报
回复
没用过,有个例子不知道能不能帮上忙
http://baobeituping.iteye.com/blog/848594
【分享:
lucene
学习资料】---<下载不扣分,回帖加1分,欢迎下载,童叟无欺>
一共有2份资料 1>
lucene
学习笔记 2> 全文检索的实现机制 【1】
lucene
学习笔记的目录如下 1. 概述 3 2.
lucene
的包结构 3 3. 索引文件格式 3 4.
lucene
中主要的类 4 4.1. Document
文档
类 4 4.1.1. 常用方法 4 4.1.2. 示例 4 4.2. Field字段类 4 4.2.1. 构造方法 4 4.2.2. Store类 5 4.2.3. Index类 5 4.2.4. 示例 5 4.3. IndexWriter类 5 4.3.1. 构造方法 5 4.3.2. 添加
文档
5 4.3.3. 性能参数 6 4.3.4. 限制Field的长度 6 4.3.5. 复合索引格式 6 4.3.6. 优化索引 6 4.3.7. 示例 6 4.4. Directory类 7 4.5. IndexReader类 7 4.5.1. 删除
文档
7 4.5.2. 反删除 7 4.5.3. 按字段删除 7 4.5.4. 示例 8 4.6. IndexModifier类 8 4.6.1. 示例 8 4.7. IndexSearcher类 9 4.7.1. 构造方法 9 4.7.2. search方法 9 4.7.3. Searcher的explain方法 10 4.7.4. 示例 10 4.8. Hits类 10 4.8.1. 概述 10 4.8.2. 常用方法 10 4.8.3. 示例 11 4.9. QueryParser类 11 4.9.1. 改变默认的布尔逻辑 11 4.9.2. 不需要分词 12 4.9.3. 设置坡度值,支持FuzzyQuery 12 4.9.4. 设置通配符,支持WildcardQuery 12 4.9.5. 查找指定的Field 12 4.9.6. 范围的查找,支持RangeQuery 13 4.9.7. 现在还不支持SpanQuery 13 4.10. MultiFieldQueryParser类--多域搜索 13 4.11. MultiSearcher类--多个索引搜索 13 4.12. ParalellMultiSearcher类---多线程搜索 14 5. 排序 14 5.1. Sort类 14 5.2. SortField类 14 5.3. 指定排序的法则 15 5.3.1. 按照
文档
的
得分
降序排序 15 5.3.2. 按
文档
的内部ID升序排序 15 5.3.3. 按照一个Field来排序 15 5.3.4. 按照多个Field来排序 15 5.3.5. 改变SortField中的Locale信息 15 6.
过滤
器
16 7. 分析器Analysis 16 7.1. 自带分析器和
过滤
器
16 7.2. 第三方过分析器 17 7.2.1. JE分词用法 17 8. 索引的合并 18 9. 各种Query 18 9.1. 概述 18 9.2. 使用特定的分析器搜索 18 9.3. 按词条搜索—TermQuery 19 9.4. 按“与或”搜索—BooleanQuery 19 9.5. 在某一范围内搜索—RangeQuery 19 9.6. 使用前缀搜索—PrefixQuery 19 9.7. 短语搜索—PhraseQuery 20 9.8. 多短语搜索—MultiPhraseQuery 20 9.9. 模糊搜索—FuzzyQuery 21 9.10. 通配符搜索—WildcardQuery 21 9.11. 跨度搜索 21 9.11.1. SpanTermQuery 21 9.11.2. SpanFirstQuery 21 9.11.3. SpanNearQuery 22 9.11.4. SpanOrQuery 22 9.11.5. SpanNotQuery 22 9.12. RegexQuery—正则表达式的查询 22 10. 评分机制 23 10.1. 概述 23 11.
Lucene
的索引“锁” 23
lucene
的
过滤
和分页
排序
过滤
和分页 仅仅把东西搜出来是不够的,好的检索工具还应当能够对检索的结果进行排序,优先将最相关的内容送出 或是按照某种规则,将检索结果送出。 1.
文档
得分
规则
文档
得分
主要是由4部分内容来决定,即tf(词条频率)、idf(反转
文档
频率)、boost(Field的激励因子) 和lengthNorm(长度因子) tf:某个关键字在某
文档
中出现次数的平方根 idf:Mat
数据结构与算法(五):算法专项 Hash、BitMap、Set、布隆
过滤
器
、中文分词、
Lucene
倒排索引
算法专项 Hash、BitMap、Set、布隆
过滤
器
、中文分词、
Lucene
倒排索引
Lucene
笔记22-
Lucene
的使用-Filter
一、Filter应用场景 假如有人搜索了一个关键词,通过
Lucene
查出来了所有的
文档
,读者比较关心最新的一些内容,因此需要将某些内容
过滤
掉。只显示用户敏感的
文档
数据即可。这就要用到
过滤
器
。 二、代码演示 public void filter(String queryString, Filter filter) { try { IndexSearcher index...
lucene
Collector
文档
收集器
编写自定义的Colletor,可以对搜索返回的
文档
实现更精确的控制。 1.接口与父类 org.apache.
lucene
.search.Collector
Java EE
67,512
社区成员
225,881
社区内容
发帖
与我相关
我的任务
Java EE
J2EE只是Java企业应用。我们需要一个跨J2SE/WEB/EJB的微容器,保护我们的业务核心组件(中间件),以延续它的生命力,而不是依赖J2SE/J2EE版本。
复制链接
扫一扫
分享
社区描述
J2EE只是Java企业应用。我们需要一个跨J2SE/WEB/EJB的微容器,保护我们的业务核心组件(中间件),以延续它的生命力,而不是依赖J2SE/J2EE版本。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章