关于文章提取关键字的问题~~有经验的朋友进来帮帮忙~

linsx1987 2011-10-20 04:23:38
想从一篇文章中,提取词库里面的频率比较高的词,也就是文章关键字提取

自己写的话,效率方面是一难点,而且工作上,时间不允许给你去慢慢研究。

在网上找了资料,有Lucene.Net是中文分词的

还有盘古分词,都还好。但那些对于做搜索引擎来说,应该比较贴切。

希望有经验的人,介绍下其他开源的程序。

或者说用Lucene.Net或者盘古分词的,有改造成功的人,传授下经验也好。

期待大家的帮助,谢谢
...全文
86 6 打赏 收藏 转发到动态 举报
写回复
用AI写文章
6 条回复
切换为时间正序
请发表友善的回复…
发表回复
linsx1987 2011-10-20
  • 打赏
  • 举报
回复
[Quote=引用 4 楼 andylaudotnet 的回复:]

SharpICTCLAS可定义stopwords
[/Quote]
盘古的也可以定义stopwords,但是好像不起作用

我下载的是最新的版本
andylaudotnet 2011-10-20
  • 打赏
  • 举报
回复
SharpICTCLAS可定义stopwords
theks 2011-10-20
  • 打赏
  • 举报
回复
lucene确实可以中文分词,如果不想要没有意义的单字,就要用二元分词器,或者带词典的分词器(Lucene的第三方分词器有很多,但Lucene.net基本上就盘古了);也可以自动计算词频,权重等等。
但有个问题就是怎么把分好的词提出来。。
熊哥club 2011-10-20
  • 打赏
  • 举报
回复
我也想知道答案
酷儿 2011-10-20
  • 打赏
  • 举报
回复
没接触过 顶一下

62,073

社区成员

发帖
与我相关
我的任务
社区描述
.NET技术交流专区
javascript云原生 企业社区
社区管理员
  • ASP.NET
  • .Net开发者社区
  • R小R
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

.NET 社区是一个围绕开源 .NET 的开放、热情、创新、包容的技术社区。社区致力于为广大 .NET 爱好者提供一个良好的知识共享、协同互助的 .NET 技术交流环境。我们尊重不同意见,支持健康理性的辩论和互动,反对歧视和攻击。

希望和大家一起共同营造一个活跃、友好的社区氛围。

试试用AI创作助手写篇文章吧