关于ElasticSearch和mongodb数据库同步的问题

Andy韩 2016-09-02 04:46:00
我现在想在我的项目中加入ElasticSearch这个搜索引擎,然后将mongodb中collection A中的数据同步到ElasticSearch上,这样我就可以用ElasticSearch进行搜索了,现在有个问题就是我对collection A的增删改操作会更改collection A中的数据,这个时候我该如何同步这种更改,使得在ElasticSearch上可以搜索到最新的数据。原来ElasticSearch有个river,但是这个东西在新版本中被拿掉了,那么在新版本中如何操作。第二个问题就是在collection A中我有个字段叫做fileurl,他只保存了我上传文件的url,现在我想把整个url对应的文件的内容同步到elasticsearch里面,这样我就可以用全文搜索在文件的内容中搜到结果了。比如,我要搜索 “apple”,那么我想那些fileurl指向的文件的内容如果也包含了apple,那么就把这些document也返回了。有没有大神做过类似的功能,可否指点一二。尤其是第二个问题。
...全文
2183 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
yjyzsl 2016-09-07
  • 打赏
  • 举报
回复
之前我们项目是低版本的ES,用的River实现的mongodb数据同步到ES。在你的问题中所述,mongodb提供了“GridFS”方式来支持大文本的存储,你可以在入库前解析url里的内容然后在存储到ES中。还一个是同步问题,现在高版本ES没有了river,可以自己现实这个功能,mongodb主从节点数据之间的同步是通过读取Oplog库进行同步的,你可以参照这个思路,自己写一个功能从Oplog中读取数据进行同步。希望我的思路能对你有所帮助。

2,760

社区成员

发帖
与我相关
我的任务
社区描述
搜索引擎的服务器通过网络搜索软件或网络登录等方式,将Internet上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据库。
社区管理员
  • 搜索引擎技术社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧