社区
Java EE
帖子详情
如何提高Lucene建立索引的效率?
fali9999
2006-02-27 02:12:58
我有10万级的文件,通过Lucene建立索引发现极耗内存,虽然调整了MergeFactor参数但没什么效果,我的机器1G内存,当索引到8000多文件时,内存耗尽,死机!
后来打算分段建立索引,即每建1万个文件优化并关闭IndexWriter一次,但发现内存并没有减小。
不知还有哪些进程没有释放掉?!如何释放?
或者还有哪些更好的方法提高索引效率(占用内存少、运行时间短)?因为以后可能会有百万、千万级的文件需要索引。
...全文
414
9
打赏
收藏
如何提高Lucene建立索引的效率?
我有10万级的文件,通过Lucene建立索引发现极耗内存,虽然调整了MergeFactor参数但没什么效果,我的机器1G内存,当索引到8000多文件时,内存耗尽,死机! 后来打算分段建立索引,即每建1万个文件优化并关闭IndexWriter一次,但发现内存并没有减小。 不知还有哪些进程没有释放掉?!如何释放? 或者还有哪些更好的方法提高索引效率(占用内存少、运行时间短)?因为以后可能会有百万、千万级的文件需要索引。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
9 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
chg2008
2006-05-25
打赏
举报
回复
70万花了12小时
------------
晕,你怎么建的,会这么慢,我的速度大慨在每分钟2w条
用多线程
fireflyjava
2006-05-17
打赏
举报
回复
我是建了500条数据后
关闭IndexWriter.
70万的数据都可以建就是创建索引速度的问题
70万花了12小时
cao_zp
2006-04-24
打赏
举报
回复
你肯定没有调整jvm的启动参数,只用了256兆内存。
andyhugb
2006-04-24
打赏
举报
回复
minMergeFactor还有一个这样的参数,控制在内存缓冲的文档数量
cao5
2006-04-21
打赏
举报
回复
System.Gc
henryqqq
2006-04-21
打赏
举报
回复
1G内存怎么够,不然 那google,baidu都不死QQ了?呵呵
肯定需要追加硬件投资。上小型机。 建索引,查询等不同功能,似乎应该分配到不同的服务器上。
TinyJimmy
2006-03-01
打赏
举报
回复
能否增量做,如果每次都重头来,那google,baidu都不死QQ了?
yyzh
2006-03-01
打赏
举报
回复
把虚拟机内存多调些就差不多
lucene
-core-3.4.0.jar
Lucene
的最主要工作是替文件的每一个字作
索引
,
索引
让搜索的
效率
比传统的逐字比较大大
提高
,Lucen提供一组解读,过滤,分析文件,编排和使用
索引
的API,它的强大之处除了高效和简单外,是最重要的是使使用者可以随时...
Lucene
全文检
索引
擎简介
建立
一个高效检索系统的关键是
建立
一个类似于科技
索引
一样的反向
索引
机制,将数据源(比如多篇文章)排序顺序存储的同时,有另外一个排好序的关键词列表,用于存储关键词==>文章映射关系,利用这样的映射关系
索引
:...
Lucene
实战讲解课程
Lucene
的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础
建立
起完整的全文检
索引
擎。
Lucene
是一套用于全文检索和搜寻的开源程式库,由Apache软件基金会...
最新
Lucene
教程
4、index是最重要的包,用于向
Lucene
提供
建立
索引
时各种操作的支持 5、queryParser提供检索时的分析支持 6、search负责检索 7、store提供对
索引
存储的支持 8、util提供一些常用工具类和常量类的支持 Ø
Lucene
...
基于
Lucene
.net的有色冶金信息化服务平台文献检索系统的研究与实现 (2013年)
针对有色冶金信息化服务平台文献资源检索功能的开发,综合运用
Lucene
.net、盘古分词等系列开源工具包,并结合中文分析器,对存储于数据库中的文档信息
建立
索引
;根据用户提交的关键字信息,实现文献资源高效检索的功能....
Java EE
67,513
社区成员
225,880
社区内容
发帖
与我相关
我的任务
Java EE
J2EE只是Java企业应用。我们需要一个跨J2SE/WEB/EJB的微容器,保护我们的业务核心组件(中间件),以延续它的生命力,而不是依赖J2SE/J2EE版本。
复制链接
扫一扫
分享
社区描述
J2EE只是Java企业应用。我们需要一个跨J2SE/WEB/EJB的微容器,保护我们的业务核心组件(中间件),以延续它的生命力,而不是依赖J2SE/J2EE版本。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章