社区
ASP
帖子详情
升星散分,谈谈分词技术是如何实现的!!!
jhwcd
2008-07-28 11:11:40
欢迎各位讨论一下谈谈分词技术是如何实现的及有什么好的算法。
...全文
384
73
打赏
收藏
升星散分,谈谈分词技术是如何实现的!!!
欢迎各位讨论一下谈谈分词技术是如何实现的及有什么好的算法。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
73 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
qildan
2009-11-26
打赏
举报
回复
学习中~现在分词遇到问题啊~哎~
共同的需要
2008-08-03
打赏
举报
回复
分词 词典是基础,算法是关键!!!
lovercoin
2008-08-02
打赏
举报
回复
Lucene有提到
笨笨兔兔兔兔兔
2008-08-02
打赏
举报
回复
很难得出来一次,不好意思
ld2099
2008-08-01
打赏
举报
回复
[Quote=引用 31 楼 jhwcd 的回复:]
引用 29 楼 ld2099 的回复:
百度有一个非常强大的中文词库,包括几乎一切的常用词,和很多专业词、一些生僻词等,Google的中文词库稍微差一些,但是google从不人工干预搜索结果,不像百度那么卑鄙。
百度搜索出来重复的太多,特别是图片很多重复的。
[/Quote]
看来你对图片很有研究
图片重复估计百度没有办法,因为它也读不懂图片里是啥
china25qd
2008-08-01
打赏
举报
回复
很有趣,这里竟然也有人研究这东西
tantaiyizu
2008-08-01
打赏
举报
回复
分词做什么?
做成tags不是很好吗?
参考:http://www.scriptlover.com
街头小贩
2008-08-01
打赏
举报
回复
学习一下!
mmidd
2008-08-01
打赏
举报
回复
学习 JF
pzhuyy
2008-08-01
打赏
举报
回复
有分来接.
jhwcd
2008-07-31
打赏
举报
回复
大家继续讨论。。。。
wcwtitxu
2008-07-31
打赏
举报
回复
来学习,来接分
neo_yoho
2008-07-31
打赏
举报
回复
是很麻烦啊
随风醉舞
2008-07-31
打赏
举报
回复
來頂一下
xkyx_cn
2008-07-31
打赏
举报
回复
中科院的一个例子:ICTCLAS
wwtdan
2008-07-31
打赏
举报
回复
顶一下!
jhwcd
2008-07-31
打赏
举报
回复
[Quote=引用 54 楼 luxu001207 的回复:]
全部代码,包括词库可以到我发布的资源里去翻,入门级别的分词程序...
[/Quote]
谢谢你的分享。
jhwcd
2008-07-31
打赏
举报
回复
[Quote=引用 54 楼 luxu001207 的回复:]
全部代码,包括词库可以到我发布的资源里去翻,入门级别的分词程序...
[/Quote]
谢谢你的分享。
kmiaoer
2008-07-31
打赏
举报
回复
xx
chenguang79
2008-07-31
打赏
举报
回复
接分
加载更多回复(53)
隐马尔科夫算法:中文
分
词
神器
本课程首先以一个简单的应用案例介绍了隐马尔科夫算法和隐马尔科夫能解决的三类问题,并构造隐马尔科夫五元组。由此引出了隐马尔科夫
分
词
算法,并以
分
词
实际应用为例,介绍了隐马尔科夫
分
词
算法的整个逻辑包括参数矩阵如何训练。同时演示并提供了隐马尔科夫
分
词
的源码。在课程最后介绍了两种其他类型的
分
词
算法并类比于隐马尔科夫介绍了算法的优缺点。
java中文
分
词
的简单
实现
java中文
分
词
的简单
实现
中文
分
词
算法算法思路算法
实现
代码及注释评价结语 中文
分
词
通俗来讲,中文
分
词
是指将一句中文句子中的所有中文词汇相互
分
隔开来。它是文本挖掘的基础,有着十
分
广阔的应用前景。下面,我们来看一看对于这个
技术
的简单
实现
。 算法 对于中文
分
词
技术
的
实现
,有许多算法可以完成,目前大致可以把算法
分
为三大类: 基于字符串匹配的
分
词
方法; 基于理解的
分
词
方法; 基于统计的
分
词
方法。 其中...
什么是搜索引擎
分
词
技术
?
古月seo 2017-08-29 20:43 一名专业的seo人员需要研究搜索引擎
分
词
技术
,通过对搜索引擎及用户阅读习惯,合理的布局标题、描述等内容,让大家都能明确知道你所要表达的意思,这边是具有seo
分
词
思维带给你好处。那什么是搜索引擎
分
词
技术
呢?我们拿搜索引擎中
技术
最牛的百度来说明下。 搜索引擎中文
分
词
技术
百度搜索引擎
分
词
技术
(用百度的官方说法)是百度对于用户提交查询的
ES中使用IK
分
词
,统计词频!
1.查询
分
词
结果 http://localhost:9200/[索引名]/ _analyze POST { "analyzer": "standard",//es默认
分
析,对英文很好
分
词
,中文全部拆
分
成单个字进行索引--》IK
分
词
了解一下:ik_smart、ik_max_word "text": "晚点" } 2.设置ik
分
词
: 一
IK中文
分
词
扩展自定义词典!!!
1.基于
分
布式系统的自定义
分
词
要求与流程设计 (见图)E:\plan\readingnote\
分
词
与索引\
分
词
\2012-4-20 2.
分
词
实现
原理——词典的加载过程 2.1.
分
词
词典的加载过程涉及到3个类,
分
别是Configuration类,Directory类,以及DictSegment类。 其中前两个类是获得配置文件,获得
分
词
词典的,为词典内容的加载做准备
ASP
28,390
社区成员
357,068
社区内容
发帖
与我相关
我的任务
ASP
ASP即Active Server Pages,是Microsoft公司开发的服务器端脚本环境。
复制链接
扫一扫
分享
社区描述
ASP即Active Server Pages,是Microsoft公司开发的服务器端脚本环境。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章