社区
Java
帖子详情
lucene 如何让其支持对姓名分词?
SuperYupd
2013-10-22 04:48:13
用庖丁中文词或者mmseg4j中文分词器让其支持对自定义的信息分词,比如,添加姓名可以对这个姓名分词。
...全文
74
回复
打赏
收藏
lucene 如何让其支持对姓名分词?
用庖丁中文词或者mmseg4j中文分词器让其支持对自定义的信息分词,比如,添加姓名可以对这个姓名分词。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
Lucene
的IK Analyzer 3.0 中文
分词
器 全解
Lucene
IK Analyzer 3.0
Lucene
的IK Analyzer 3.0 中文
分词
器
Lucene
IK Analyzer 3.0
Lucene
的IK Analyzer 3.0 中文
分词
器
Lucene
IK Analyzer 3.0
Lucene
的IK Analyzer 3.0 中文
分词
器
基于
Lucene
的全文搜索引擎实现项目-使用WebMagic爬取博客园数据并利用IKAnalyzer进行中文
分词
处理-通过
Lucene
构建索引实现高效关键字搜索与同义词扩展匹配功能.zip
基于
Lucene
的全文搜索引擎实现项目_使用WebMagic爬取博客园数据并利用IKAnalyzer进行中文
分词
处理_通过
Lucene
构建索引实现高效关键字搜索与同义词扩展匹配功能.zip毕业设计课题--智能农业管理系统
IKAnalyzer中文
分词
器
IKAnalyzer中文
分词
器V3.1.6使用手册.pdf
盘古
分词
工具
这是盘古
分词
小工具,用于动态维护词典,适合初学者结合
Lucene
研究盘古
分词
。
IKAnalyzer 3.0 中文
分词
器
1.IKAnalyzer3.0介绍 IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文
分词
工具包。从2006年12月推出1.0版开始,IKAnalyzer 已经推出了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典
分词
和文法分析算法的中文
分词
组件。新版本的IKAnalyzer3.0 则发展为面向Java的公用
分词
组件,独立于
Lucene
项目,同时提供了对
Lucene
的默认优化实现。 1.2IKAnalyzer3.0特性 * 采用了特有的“正向迭代最细粒度切分算法“,具有50万字/秒的高速处理能力。 * 采用了多子处理器分析模式,
支持
:英文字母(IP地址、Email、URL)、数字(日期,常用中文数量词,罗马数字,科学计数法),中文词汇(
姓名
、地名处理)等
分词
处理。 * 优化的词典存储,更小的内存占用。
支持
用户词典扩展定义 * 针对
Lucene
全文检索优化的查询分析器IKQueryParser(作者吐血推荐);采用歧义分析算法优化查询关键字的搜索排列组合,能极大的提高
Lucene
检索的命中率。
Java
51,410
社区成员
86,070
社区内容
发帖
与我相关
我的任务
Java
Java相关技术讨论
复制链接
扫一扫
分享
社区描述
Java相关技术讨论
java
spring boot
spring cloud
技术论坛(原bbs)
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章