storm 用于接收大量实时的车载GPS数据。求教接收方案？？？

Roger_dai 2013-05-12 11:14:31

最近在学习storm，需求是实时接收5万辆车子上的GPS数据，原来的想法是：服务器开启一个socket监听，GPS设备通过TCP协议把数据发送到服务器的socket上，在服务器上监听接收数据就行了。我想问能否在storm集群中实现接收存储，是否可以在各个节点中spout中开启socket监听，不断接收数据，作为数据来源，然后发射到相应bolt进行解析存储，数据则存储在集群的各个节点上。

我的疑问是，如果运行在一个storm集群上的吧，GPS设备上传数据的时候应该是发送到指定的服务器，而不是直接发送到工作节点的电脑上的，那么storm集群上的各个节点怎么如何能接收到数据呢？？难道集群工作时对外界是透明的，在各个节点上开启socket监听都能接收GPS设备的数据？？

对集群的概念也不太清楚，希望大家帮我解答一下，给点思路也好。

...全文

202 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

撸大湿 2013-05-12

打赏
举报

回复

我对storm只有一点皮毛的研究，说错了请拍砖数据传输针对集群，CLIENT并不会直接控制节点机，所有的任务都有nimbus负责，CLIENT不会直接访问Supervisor，他们之间是由Zookeeper调度控制的，这点和HBASE很像~ 就像LZ说的集群工作时对外界是透明的！！！！ storm的任务调度和Hadoop的MapReduce很像，只是很像~~~，他们有很大的区别 MapReduce的任务生命周期是由一个一个JOB形成的，当JOB结束时，任务也就结束了 storm则不同，它的管道是对所有任务开放的，所以不会有关闭的概念，除非你KILL守护进程建议LZ线去了解一下storm的特性和集群架构，最好自己动手配一个。实践是最好的学习方法

在短时间内，Apache Storm成为分布式实时处理系统的标准，允许您处理大量的数据，类似于Hadoop。Apache Storm是用Java和Clojure写的。它仍然是实时分析的领导者。本教程将探讨Apache Storm的原理，分布式消息传递，...

Storm???? Storm是Twitter开源的分布式实时大数据处理框架，被业界称为实时版Hadoop。随着越来越多的场景对Hadoop的MapReduce高延迟无法容忍，比如网站统计、推荐系统、预警系统、金融系统(高频交易、股票)等等， 1、DAG：有向无循环图它由有限个顶点和有向边组成，每条有向边都从一个顶点指向另一个顶点；从任意一个顶点出发都不能通过这些有向边回到原来的顶点。有向无环图就是从一个图中的任何一点出发，不管走过多少个分叉路口，都没有回到原来这个点的可能性。 2、Stor

文章目录Storm介绍为什么用storm？Storm的核心组件storm特征storm与MapReduce区别storm与Spark Streaming区别Storm时执行力过程 Storm介绍 Storm是Twitter开源的分布式实时大数据处理框架，最早开源于github，从0.9.1版本之后，归于Apache社区，被业界称为实时版Hadoop。随着越来越多的场景对Hadoop的MapRedu...

作者：禅与计算机程序设计艺术 Storm 实时计算：Storm 的实时计算原理和使用方法在大数据处理领域，实时计算是一个重要的话题。在 Hadoop 生态系统中，Storm 是一个实时计算框架，它可以在实时数据流的基础上进行实时计算。本文将介绍 St

1、什么是 Storm？ Storm是一个分布式实时大数据处理系统，它是一个流数据框架，具有最高的摄取率，虽然Storm是无状态的，它通过ZooKeeper管理分布式环境和集群状态，保证每个消息将通过拓扑至少处理一次关键字：实时、流数据 storm类似图片的电梯，一直往上传送数据，数据一上去就被传送、处理 2、Storm核心概念 tuple 元组，数据结构，有序的元素列表，通常是任意类型的数据，outputCollector.emit(new Values(s1));，这里的new Value(

Hadoop生态社区

20,808

社区成员

4,690

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章