分享 Lucene中文分词组件V1.2.2!?

key101 2006-06-14 09:50:05
1.2.2
完善了中英文噪声词典

1.2.1
修正中文数字成语无法识别的问题

1.2
增加中文数字的匹配(如:二零零六)
数量词采用“n”作为数字通配符
优化词典结构以便修改调整

1.1
增加扩展词典的静态读取方法

1.0.1
修正无法识别生僻字的问题

1.0
支持英文、数字、中文(简体)混合分词
常用的数量和人名的匹配
超过22万词的词库整理
实现正向最大匹配算法

下载地址:http://www.jesoft.cn/posts/list/5.page
...全文
136 3 打赏 收藏 转发到动态 举报
写回复
用AI写文章
3 条回复
切换为时间正序
请发表友善的回复…
发表回复
yonghar 2006-06-15
  • 打赏
  • 举报
回复
顶一下
这个冬冬不错 :o
agreatman2008 2006-06-14
  • 打赏
  • 举报
回复
Lucene是开源的阿,你可以自己找的
chg2008 2006-06-14
  • 打赏
  • 举报
回复
有什么用呢,又不公布源代码?

62,614

社区成员

发帖
与我相关
我的任务
社区描述
Java 2 Standard Edition
社区管理员
  • Java SE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧