Luke中关于Term count的数量问题

frescox 2009-05-21 10:19:48
Luke版本:lukeall-0.9.2.jar

问题描述:

1、首先我利用lucene的demo为src文件夹内的所有文件建立了索引。

java org.apache.lucene.demo.IndexFiles {full-path-to-lucene}/src


添加document部分代码:

Document doc = new Document();
doc.add(new Field("path", f.getPath(), Field.Store.YES, Field.Index.NOT_ANALYZED));
doc.add(new Field("modified",
DateTools.timeToString(f.lastModified(), DateTools.Resolution.MINUTE),
Field.Store.YES, Field.Index.NOT_ANALYZED));
doc.add(new Field("contents", new FileReader(f)));


2、通过Luke打开建立好的索引,查看Available fields and Term counts per field区域,内容如下:

Name Term count %

contents 1,945 98.68%
modified 0 0%
path 24 1.22%


通过点击show top terms查看每个field的实际term数量,发现modified和path所显示的实际数量比上面列表给出的少1个,而contents数量是符合的。

请问这是什么原因?

...全文
77 8 打赏 收藏 转发到动态 举报
写回复
用AI写文章
8 条回复
切换为时间正序
请发表友善的回复…
发表回复
frescox 2009-05-27
  • 打赏
  • 举报
回复
jingdch 2009-05-27
  • 打赏
  • 举报
回复
你过来直接问我...
frescox 2009-05-26
  • 打赏
  • 举报
回复
Up
frescox 2009-05-22
  • 打赏
  • 举报
回复
UP
frescox 2009-05-22
  • 打赏
  • 举报
回复
[Quote=引用 3 楼 javacaspnet 的回复:]
配置
[/Quote]

可以说详细一点吗?
西瓜 2009-05-22
  • 打赏
  • 举报
回复
Luke是啥?
javacaspnet 2009-05-22
  • 打赏
  • 举报
回复
配置
Dantin 2009-05-21
  • 打赏
  • 举报
回复
UP

67,512

社区成员

发帖
与我相关
我的任务
社区描述
J2EE只是Java企业应用。我们需要一个跨J2SE/WEB/EJB的微容器,保护我们的业务核心组件(中间件),以延续它的生命力,而不是依赖J2SE/J2EE版本。
社区管理员
  • Java EE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧