社区
C#
帖子详情
lucene.net的应用,怎么样实现中文的全文检索,也就是怎么处理所有的文本格式,对中文等进行分词索引?
huguyue6670
2008-05-01 10:28:40
lucene.net的应用,怎么样实现中文的全文检索,也就是怎么处理所有的文本格式,对中文等进行分词索引?
...全文
279
8
打赏
收藏
lucene.net的应用,怎么样实现中文的全文检索,也就是怎么处理所有的文本格式,对中文等进行分词索引?
lucene.net的应用,怎么样实现中文的全文检索,也就是怎么处理所有的文本格式,对中文等进行分词索引?
复制链接
扫一扫
分享
转发到动态
举报
AI
作业
写回复
配置赞助广告
用AI写文章
8 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
xinqq163
2011-03-27
打赏
举报
回复
正想弄这个功能 ,还不会
lwtbysj
2009-03-16
打赏
举报
回复
对这方面不是很懂UP下!
Yeeler
2008-05-05
打赏
举报
回复
楼主问的问题非常宽泛,实在是难回答。
分词,尤其是中文分词,难度大,新词召回率低,不像英文,每个单词直接都有空格,动词变化都有规律可循。目前中文分词,互联网上开源的也只有中科院的分词,但存在bug。
lucene已经发布2.30版本了,lucene.net作者已经暂停维护,目前版本还是2.0,目前网上有大量的资料,《开发自己的搜索引擎lucene 2.0 + heeritrix》不错,可以读读,读完你就不会上来问这样的问题了。
songyangaaron
2008-05-05
打赏
举报
回复
文本格式Lucene都可以处理啊,中科院的分词效果还可以,不过学习版的DLL调用时容易出错。
[Quote=引用 2 楼 huguyue6670 的回复:]
楼上的你的文本格式处理怎么做的,像word、pdf、html等等?中科院的分词效果怎么样,能不能给点你们用的分词。
[/Quote]
美丽海洋
2008-05-04
打赏
举报
回复
我们的分词有自己的代码,采用的是基于统计和词典相结合的方式完成的,多文本处理用的是ifilter
huguyue6670
2008-05-04
打赏
举报
回复
楼上的你的文本格式处理怎么做的,像word、pdf、html等等?中科院的分词效果怎么样,能不能给点你们用的分词。
songyangaaron
2008-05-04
打赏
举报
回复
用过Java版的Lucene,首先解决中文分词的问题,Lucene提供的中文分词弱了些,可以考虑中科院中文分词组件。google ICTCLAS 即可。
然后是建立索引,处理用户请求什么的,就比较简单了。
Lucene
.Net
实现
全文检索
本案例通过
.Net
MVC4基础上,针对
Lucene
.Net
实现
全文检索
的
应用
。通过查询数据表中数据,创建
索引
,通过统一输入框
进行
全文检索
。可以
进行
对
索引
的增删改查功能。
lucene
.NET
中文
分词
lucene
.NET
中文
分词
高亮
lucene
.NET
中文
分词
高亮
lucene
.NET
中文
分词
高亮
lucene
.NET
中文
分词
高亮
Lucene
.NET
结合Sql建立
全文检索
Demo源码
这是用
Lucene
.NET
结合Sql建立
全文检索
Demo的源码,适合初学者学习
Lucene
,其中包含所需的DLL文件。
Lucene
.net
盘古
分词
C#
工厂将所有LOG放在共享盘里面,用这个来找超级快.
Lucene
.Net
+盘古
分词
搜
索引
擎
Lucene
.Net
+盘古
分词
搜
索引
擎,
Lucene
.Net
2.9.4.版本,vs2012开发,通过实例可以有初步的认识和了解
C#
111,098
社区成员
642,554
社区内容
发帖
与我相关
我的任务
C#
.NET技术 C#
复制链接
扫一扫
分享
社区描述
.NET技术 C#
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
让您成为最强悍的C#开发者
试试用AI创作助手写篇文章吧
+ 用AI写文章