社区
C#
帖子详情
lucene.net的应用,怎么样实现中文的全文检索,也就是怎么处理所有的文本格式,对中文等进行分词索引?
huguyue6670
2008-05-01 10:28:40
lucene.net的应用,怎么样实现中文的全文检索,也就是怎么处理所有的文本格式,对中文等进行分词索引?
...全文
288
8
打赏
收藏
lucene.net的应用,怎么样实现中文的全文检索,也就是怎么处理所有的文本格式,对中文等进行分词索引?
lucene.net的应用,怎么样实现中文的全文检索,也就是怎么处理所有的文本格式,对中文等进行分词索引?
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
8 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
xinqq163
2011-03-27
打赏
举报
回复
正想弄这个功能 ,还不会
lwtbysj
2009-03-16
打赏
举报
回复
对这方面不是很懂UP下!
Yeeler
2008-05-05
打赏
举报
回复
楼主问的问题非常宽泛,实在是难回答。
分词,尤其是中文分词,难度大,新词召回率低,不像英文,每个单词直接都有空格,动词变化都有规律可循。目前中文分词,互联网上开源的也只有中科院的分词,但存在bug。
lucene已经发布2.30版本了,lucene.net作者已经暂停维护,目前版本还是2.0,目前网上有大量的资料,《开发自己的搜索引擎lucene 2.0 + heeritrix》不错,可以读读,读完你就不会上来问这样的问题了。
songyangaaron
2008-05-05
打赏
举报
回复
文本格式Lucene都可以处理啊,中科院的分词效果还可以,不过学习版的DLL调用时容易出错。
[Quote=引用 2 楼 huguyue6670 的回复:]
楼上的你的文本格式处理怎么做的,像word、pdf、html等等?中科院的分词效果怎么样,能不能给点你们用的分词。
[/Quote]
美丽海洋
2008-05-04
打赏
举报
回复
我们的分词有自己的代码,采用的是基于统计和词典相结合的方式完成的,多文本处理用的是ifilter
huguyue6670
2008-05-04
打赏
举报
回复
楼上的你的文本格式处理怎么做的,像word、pdf、html等等?中科院的分词效果怎么样,能不能给点你们用的分词。
songyangaaron
2008-05-04
打赏
举报
回复
用过Java版的Lucene,首先解决中文分词的问题,Lucene提供的中文分词弱了些,可以考虑中科院中文分词组件。google ICTCLAS 即可。
然后是建立索引,处理用户请求什么的,就比较简单了。
Lucene
.Net
实现
全文检索
本案例通过
.Net
MVC4基础上,针对
Lucene
.Net
实现
全文检索
的
应用
。通过查询数据表中数据,创建
索引
,通过统一输入框
进行
全文检索
。可以
进行
对
索引
的增删改查功能。
lucene
.NET
中文
分词
lucene
.NET
中文
分词
高亮
lucene
.NET
中文
分词
高亮
lucene
.NET
中文
分词
高亮
lucene
.NET
中文
分词
高亮
Lucene
.net
盘古
分词
C#
工厂将所有LOG放在共享盘里面,用这个来找超级快.
Lucene
.NET
结合Sql建立
全文检索
Demo源码
这是用
Lucene
.NET
结合Sql建立
全文检索
Demo的源码,适合初学者学习
Lucene
,其中包含所需的DLL文件。
Lucene
.Net
+盘古
分词
搜
索引
擎
Lucene
.Net
+盘古
分词
搜
索引
擎,
Lucene
.Net
2.9.4.版本,vs2012开发,通过实例可以有初步的认识和了解
C#
111,112
社区成员
642,554
社区内容
发帖
与我相关
我的任务
C#
.NET技术 C#
复制链接
扫一扫
分享
社区描述
.NET技术 C#
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
让您成为最强悍的C#开发者
试试用AI创作助手写篇文章吧
+ 用AI写文章