数据采集卡采集到的数据如何写入hadoop?

mzw_0359 2017-12-11 11:19:17

老板让我建个数据库，做故障诊断用，数据采集卡的数据应该如何写入hadoop？或者能给我这个小白推荐点这方面的资料．还有，有人说hadoop在高频的写入时性能不太好，做故障诊断时一个传感器的采样频率就几千上万，高频的有几十万，这不是高频的写入吗？为什么我看论文里好多人还是用hadoop做故障诊断的数据库？

...全文

144 回复打赏收藏转发到动态举报

写回复

回复

切换为时间正序

请发表友善的回复…

发表回复

大数据分析Hadoop

要运行这个实例，必须先安装好hadoop和hive环境，环境部署可以参考我之前的文章：大数据Hadoop原理介绍+安装+实战操作（HDFS+YARN+MapReduce）大数据Hadoop之——数据仓库Hive 【实例代码如下】 #!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2022/5/8 10:35 # @Author : liugp # @File : Data2HDFS.py """ # pip instal

flume部署，数据采集，日志采集，hdfs，hadoop

上一节中我们讲了如何对用户画像建模，而建模之前我们都要进行数据采集。数据采集是数据挖掘的基础，没有数据，挖掘也没有意义。很多时候，我们拥有多少数据源，多少数据量，以及数据质量如何，将决定我们挖掘产出的成果会怎样。举个例子，你做量化投资，基于大数据预测未来股票的波动，根据这个预测结果进行买卖。你当前能够拿到以往股票的所有历史数据，是否可以根据这些数据做出一个预测率高的数据分析系统呢？实际上，如...

数据仓库这个项目的数据采集部分主要分为两层，第一层就是用Flume通过tailDirSource把在/tmp/logs/下的数据采集到kafka中；第二层就是把在kafka中的数据采集到HDFS中。目前我已经做好了这两层的数据采集，现在来写一下具体过程：第一层数据采集第一层的数据采集通过Flume采集数据生成的目录下的数据，数据是在hadoop102和103生成的，所以第一层采集是在hadoop102和1hadoop103进行采集，具体的Flume配置文件如下： #a1是agent的名称，a1中定义

Hadoop生态社区

20,809

社区成员

4,691

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章