社区
搜索引擎技术
帖子详情
关于solr中使用mmesg4j的分词问题
青鬆下的坚躯
2016-09-19 09:12:55
环境:solr 6.1.0、集成的词库memesg4j
在分词的时候有这样一种情况,如下:
“白天然”切分出来为什么是“
白天、然
”,我想要的是“
白天、天然
”,不知道有没有办法?
白天和天然这两个词组在分词文档里都有。
...全文
994
1
打赏
收藏
关于solr中使用mmesg4j的分词问题
环境:solr 6.1.0、集成的词库memesg4j 在分词的时候有这样一种情况,如下: “白天然”切分出来为什么是“白天、然”,我想要的是“白天、天然”,不知道有没有办法? 白天和天然这两个词组在分词文档里都有。
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
1 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
nmiirq
2016-10-23
打赏
举报
回复
一定要用2m分词器吗?我们用IK,没注意你这个情况,回头看看,你也可以换个分词器试试。
solr
中
的
mmesg4j
中
文
分词
器安装
solr
中
的
mmesg4j
中
文
分词
器安装详细步骤文档
solr
学习笔记-增加
mmesg4J
中
文
分词
solr
版本6.1、centos6.7、
mmesg4j
版本2.30
solr
安装目录:/usr/local/
solr
-6.1.0 1、下载
mmesg4j
包: 地址:https://github.com/chenlb/mmseg4j-
solr
2、解压/复制mmseg4j-core-1.10.0.jar、mmseg4j-
solr
-2.3.0.jar 到/us...
solr
5.0集成mmseg4j
分词
器
solr
5.0集成mmseg4j
分词
器
MMesg4j
分词
mmseg4j 是用 Chih-Hao Tsai 的 MMSeg 算法实现的
中
文
分词
器。并实现了 lucene 的 analyzer 和
solr
的 TokenizerFactory 以方便在 Lucene 和
Solr
中
使用
。 对 lucene 来说 ,mmseg4j 有以下四个 analyzer:SimpleAnalyzer、ComplexAnalyzer、MaxWordAnalyze...
solr
4.4整合mmseg4j-1.9
中
文
分词
器
下载
mmesg4j
-1.9 将mmseg4j-1.9.1\mmseg4j-1.9.1\dist
中
的
搜索引擎技术
2,760
社区成员
2,052
社区内容
发帖
与我相关
我的任务
搜索引擎技术
搜索引擎的服务器通过网络搜索软件或网络登录等方式,将Internet上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据库。
复制链接
扫一扫
分享
社区描述
搜索引擎的服务器通过网络搜索软件或网络登录等方式,将Internet上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据库。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章