社区
Java
帖子详情
关于ictclas(中文自然语言处理)
huhuan19890427
2011-08-10 08:29:57
大虾们好:
现在在研究ictclas, 把中科院的代码套上去基本能跑了,但还有一些文件不知道啥意思,以致于读源码时不容易理解。
不知道有哪个大哥研究过,想请教一下lexical.ctx,nr.ctx,ns.ctx,tr.ctx 这几个文件的用途,我用文件流解析出来后里面全是数字,每行的个数和列数都相等,这些数字我没找到规律,从0至几万的都有;还请哪位大哥帮帮忙啊! 小弟感激不尽! 最后说得详细一点。 谢..................
...全文
52
回复
打赏
收藏
关于ictclas(中文自然语言处理)
大虾们好: 现在在研究ictclas, 把中科院的代码套上去基本能跑了,但还有一些文件不知道啥意思,以致于读源码时不容易理解。 不知道有哪个大哥研究过,想请教一下lexical.ctx,nr.ctx,ns.ctx,tr.ctx 这几个文件的用途,我用文件流解析出来后里面全是数字,每行的个数和列数都相等,这些数字我没找到规律,从0至几万的都有;还请哪位大哥帮帮忙啊! 小弟感激不尽! 最后说得详细一点。 谢..................
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
Python
自然语言处理
工具小结
本文对比分析了多种
中文
自然语言处理
工具,包括NLTK、Pattern、TextBlob、Gensim等Python库,以及OpenNLP、Stanford NLP、
ICTCLAS
等专业工具在
中文
分词、命名实体识别等方面的应用。
NLP工具的一些整理~
本文汇总了多种
自然语言处理
(NLP)工具,包括哈工大的Ltp3.X、StanfordNLP、FudanNLP、HanLP、
ICTCLAS
、Ansj及结巴分词,覆盖
中文
分词、词性标注、句法分析等功能,适用于不同规模的NLP项目。
常用处理(NLP)
本文总结了多种
自然语言处理
(NLP)工具,包括IKAnalyzer、
ICTCLAS
、FudanNLP及StanfordNLP系列工具等,涵盖了
中文
分词、词性标注、命名实体识别等功能。
中文
NLP (2) --
ICTCLAS
分词
本文深入探讨了
中文
分词的三大流派:机械式分词法、基于语法和规则的分词法及统计学分词法。介绍了主流分词技术的步骤,包括字符切分、查询词典、构建词图、计算最小权重路径等,以及如何使用隐马尔科夫链语言模型进行未登录词识别。
自然语言处理
(NLP)常用开源工具总结----不定期更新
本文汇总了多种开源
自然语言处理
工具,包括IKAnalyzer、
ICTCLAS
、FudanNLP及Stanford NLP系列工具等,涉及
中文
分词、词性标注、命名实体识别等功能,并对比了它们的特点及适用场景。
Java
51,409
社区成员
86,085
社区内容
发帖
与我相关
我的任务
Java
Java相关技术讨论
复制链接
扫一扫
分享
社区描述
Java相关技术讨论
java
spring boot
spring cloud
技术论坛(原bbs)
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章