扩展了一下lucene2.9.1 SmartChineseAnalyzer 的词库，使它能添加、删除词，欢迎试用

bjsuo 2009-11-25 05:52:43

自带的分析器字典的词库是只读的，不能改，修改了一下，源文件和类都放在上面了
http://download.csdn.net/source/1845731

...全文

259 回复打赏收藏转发到动态举报

写回复

回复

切换为时间正序

请发表友善的回复…

发表回复

本文介绍了一个基于Lucene的智能分词扩展方法，通过修改源码并添加扩展词来增强分词效果。该方法实现了扩展词的添加、排序及保存，并提供了完整的代码示例。

本文详细介绍使用Lucene创建中文文档索引的过程，包括使用SmartChineseAnalyzer进行中文分词，对比StandardAnalyzer，以及如何管理索引的删除和更新。

博客讨论了使用Lucene的SmartChineseAnalyzer进行中文分词，并展示了如何扩展Analyzer来处理同义词。在不同的同义词设置下，搜索结果可能会有所不同。文章还提供了创建索引、高亮显示和查询的方法实现。

本文介绍了Lucene 2.9版本中新增的中文分词功能，并对比了ChineseAnalyzer、CJKAnalyzer及SmartChineseAnalyzer三个类的分词效果。重点展示了如何使用SmartChineseAnalyzer进行中文分词，并提供了具体的Java实现代码。

本文详细介绍了如何通过自定义停用词集和使用Lucene的SmartChineseAnalyzer对中文文本进行更精确的分词与过滤处理，以提升文本处理效率和准确性。

搜索引擎技术

2,759

社区成员

2,049

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章