如何设计生产环境中flume采集非结构化数据的方案

qq_38827686 2018-12-18 08:52:15

现在想到的方案是，将非结构化数据源定时复制到flume监控的文件夹中，进行采集，还有没有其它生产环境下的设计方案。

...全文

335 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

deepthinkers 2018-12-18

我之前是从各种应用系统的日志的服务器所在位置去他们的日志目录去拿，思路和你这个差不多，搞个监控目录，定时复制，flume安装到几个系统的节点上，把数据采到以后，送到kafka，然后后台spark根据kafka的topic进行消费。

926

社区成员

645

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

加载中

社区公告

暂无公告

试试用AI创作助手写篇文章吧