关于solr中使用mmesg4j的分词问题

青鬆下的坚躯 2016-09-19 09:12:55
环境:solr 6.1.0、集成的词库memesg4j
在分词的时候有这样一种情况,如下:

“白天然”切分出来为什么是“白天、然”,我想要的是“白天、天然”,不知道有没有办法?
白天和天然这两个词组在分词文档里都有。
...全文
993 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
nmiirq 2016-10-23
  • 打赏
  • 举报
回复
一定要用2m分词器吗?我们用IK,没注意你这个情况,回头看看,你也可以换个分词器试试。

2,760

社区成员

发帖
与我相关
我的任务
社区描述
搜索引擎的服务器通过网络搜索软件或网络登录等方式,将Internet上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据库。
社区管理员
  • 搜索引擎技术社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧