社区
IBM云计算
帖子详情
关于NLPIR中文分词系统java版的使用
♪生活有点甜
2017-03-30 04:17:08
小弟最近在做毕设,用到了NLPIR中文分词系统java版,经过几天的研究和使用能对一段文字进行初步的分词了,然后我遇到了一个很大的问题,就是怎么对停用词进行过滤和计算词频,查看API文档发现时C语言写的,小弟十分迷茫,希望在这方面有研究的大神指点一下
...全文
719
回复
打赏
收藏
关于NLPIR中文分词系统java版的使用
小弟最近在做毕设,用到了NLPIR中文分词系统java版,经过几天的研究和使用能对一段文字进行初步的分词了,然后我遇到了一个很大的问题,就是怎么对停用词进行过滤和计算词频,查看API文档发现时C语言写的,小弟十分迷茫,希望在这方面有研究的大神指点一下
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
nlpir
汉语分词
系统
nlpir
汉语分词
系统
(
使用
java
封装整理) 可实现词频,词性,分词、情感预判、聚类授权等大数据相关算法。
20131115123549_
nlpir
_ictclas2013_u20131115_release分词包
针对LIBSVM进行文本分类,内含Data文档,需要替代程序中的Data文档
中文分词
与关键词提取(
NLPIR
java
版
)
NLPIR
汉语分词
系统
(又名ICTCLAS2013),主要功能包括
中文分词
;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;这个是
java
版
本
中文分词
器
nlpir
Java
32位开发接口
需配合完整开发包
使用
,
NLPIR
汉语分词
系统
(又名ICTCLAS2013),主要功能包括
中文分词
;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;张华平博士先后倾力打造十余年,内核升级10次。 全球用户突破20万,先后获得了2010年钱伟长中文信息处理科学技术奖一等奖,2003年国际SIGHAN分词大赛综合第一名,2002年国内973评测综合第一名。
NLPIR
-ICTCLAS分词
系统
开发手册2016
版
词法分析是自然语言处理的基础与关键。张华平博士在多年研究工作积累的 基础上,研制出了
NLPIR
分词
系统
,主要功能包括
中文分词
;英文分词;词性标 注;命名实体识别;新词识别;关键词提取;支持用户专业词典与微博分析。
NLPIR
系统
支持多种编码(GBK编码、UTF8编码、BIG5编码)、多种操作
系统
(Windows, Linux , FreeBSD 等所有主流操作
系统
)、多种开发语言与平台(包括: C/C++/C#,
Java
,Python,Hadoop 等)。
IBM云计算
1,152
社区成员
244
社区内容
发帖
与我相关
我的任务
IBM云计算
该论坛主要探讨基于IBM云计算的开发技术,并为网友们提供自由交流的平台。
复制链接
扫一扫
分享
社区描述
该论坛主要探讨基于IBM云计算的开发技术,并为网友们提供自由交流的平台。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章