社区
搜索引擎技术
帖子详情
elasticsearch5 怎么实现中文分词和同义词
github_29245047
2017-04-05 06:47:32
我现在在用中文分词,业务需要使用同义词,不知大怎么设置,网上都是老版本的教程
...全文
1499
1
打赏
收藏
elasticsearch5 怎么实现中文分词和同义词
我现在在用中文分词,业务需要使用同义词,不知大怎么设置,网上都是老版本的教程
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
1 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
春风十里不如ni
2017-09-06
打赏
举报
回复
中文分词用ik。同义词的话你配个同义词的文件,在建立索引的时候设置一下就可以了
es安装ik分词器
elasticsearc
h默认的分词效果有时候并不满足我们的需求,这将介绍
elasticsearc
h安装ik分词器详解
ElasticSearc
h安装包整理,包含Hanlp分词,IK分词,x-pack,,Mysql动态加载停用词、基础词、
同义词
ElasticSearc
h安装包整理,包含Hanlp分词,IK分词,x-pack,,Mysql动态加载停用词、基础词、
同义词
,个人整理的
ElasticSearc
h7.9.0安装压缩包,其中的
同义词
,基础词,停用词mysql动态加载属于个人完善并编译,多年运用于不同生产环境的部署,Hanlp 分词模型太大,CSDN上传资源限制小于1G,所以压缩包不含Hanlp分词插件,需要的留言。
基于HanLP自然语言处理包的
elasticsearc
h分词器 hanlp-tokenizer-master
基于HanLP自然语言处理包的
elasticsearc
h分词器 功能 本分词器使用HanLP提供的维特比分词 屏蔽了本地配置用户词典 增加
同义词
索引功能 增加远程词典热更新(用户词典,停词典,
同义词
典) 使用 目前支持的es版本为2.3.5和5.6.3,其他版本请修改plugin-descriptor.properties文件的es版本
Elasticsearc
h window 压缩包
ES是一个基于Lucene的分布式全文搜索服务器,和SQL Server的全文索引(Fulltext Index)有点类似,都是基于分词和分段的全文搜索引擎,具有分词,
同义词
,词干查询的功能,但是ES天生具有分布式和实时的属性,本随笔演示在Windows环境中安装
ElasticSearc
h,以及用于管理
ElasticSearc
h的Head插件
jcseg,Jcseg 是基于 mmseg 算法的一个轻量级
中文分词
器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于 Jetty 的 web 服务器,方便各大语言直接 http 调用,同时提供了最新版本的 lucene, solr,
elasticsearc
h 的分词接口!.zip
Jcseg是基于 mmseg 算法的一个轻量级
中文分词
器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于 Jetty 的 web 服务器,方便各大语言直接 http 调用,同时提供了最新版本的 lucene, solr,
elasticsearc
h 的分词接口!Jcseg自带了一个 jcseg.properties 文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加
同义词
等!
搜索引擎技术
2,760
社区成员
2,052
社区内容
发帖
与我相关
我的任务
搜索引擎技术
搜索引擎的服务器通过网络搜索软件或网络登录等方式,将Internet上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据库。
复制链接
扫一扫
分享
社区描述
搜索引擎的服务器通过网络搜索软件或网络登录等方式,将Internet上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据库。
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章