刚完成的在Lucene.net中, 增加自己的中文分词Analyzer

yy8354 2007-01-31 10:12:08
http://blog.likeshow.net/article.asp?id=39
分词组件用的SHOOTSEG 继承Lucene.Net.Analysis.Analyzer,Lucene.Net.Analysis.Tokenizer,Lucene.Net.Analysis.TokenFilter实现了三个新子类ChineseAnalyer,ChineseTokenizer,ChineseFilter

使用只需要用ChineseAnalyer替换默认使用的StandardAnalyzer就OK了

文章内有详细代码及说明,并有编译好的组件提供使用
...全文
1319 11 打赏 收藏 转发到动态 举报
写回复
用AI写文章
11 条回复
切换为时间正序
请发表友善的回复…
发表回复
zhang_dongpeng 2009-09-16
  • 打赏
  • 举报
回复
广州达梦网络科技有限公司是一家致力于为提供各行业垂直搜索和元搜索服务的专业化公司。公司坚持以服务客户为中心,以技术创新为手段,为客户提供各个行业、任意搜索源精确搜索的解决方案,以及中个小企业信息服务的解决方案!
主要的搜索引擎案例有:万帮生活搜索,114soso网,万帮知识经验搜索,佛教新闻、网页、图片、视频、经典、词典、mp3等搜索。
能为您快速定制各类搜索引擎,如果您各类搜索引擎需求,请联系我们:020-22174900,QQ:46244150。
tianjiao85 2008-12-23
  • 打赏
  • 举报
回复
学习,支持,mark。
kellerdu 2008-06-01
  • 打赏
  • 举报
回复

IKAnalyzer.Net
一个不错的开源分词程序,支持Lucene.Net。
推荐一下:
http://www.zgkw.cn/forums/blogs/dyx/archive/2008/02/18/59778.aspx
zhrubin 2008-05-25
  • 打赏
  • 举报
回复
跟你一起鄙视5楼

[Quote=引用 7 楼 t123echo 的回复:]
to 5楼
开源的才方便大家一起学习嘛,如果学习交流都被称作'吹'的话,没人敢理你了
[/Quote]
t123echo 2008-05-05
  • 打赏
  • 举报
回复
to 5楼
开源的才方便大家一起学习嘛,如果学习交流都被称作'吹'的话,没人敢理你了
knowledge_Is_Life 2008-05-01
  • 打赏
  • 举报
回复
我也想了解,谢谢LZ.
cangzhuo_com 2008-04-30
  • 打赏
  • 举报
回复
垃圾, 用个开源的也跑来吹,不知廉耻
UltraBejing 2008-04-30
  • 打赏
  • 举报
回复
以后需再关注,现在先帮你顶一下
littlegang 2007-06-11
  • 打赏
  • 举报
回复
似乎没有好的中文分词工具
qlhycf 2007-05-21
  • 打赏
  • 举报
回复
我是直接用SHOOTSEG分词,用空格分格,用SimpleAnalyzer搞定
kwklover 2007-03-07
  • 打赏
  • 举报
回复
支持下

2,760

社区成员

发帖
与我相关
我的任务
社区描述
搜索引擎的服务器通过网络搜索软件或网络登录等方式,将Internet上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据库。
社区管理员
  • 搜索引擎技术社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧