基于Hadoop的出租车营运数据分析
数据量为2个G的数据量。(北京市出租车一天的数据量)
需求功能实现:1.提取运营状态做空驶分析做出图表 2.载客热点分析
会做的私聊我
qq:807756466
数据以ASCII文本表示,以逗号为分隔符,以回车换行符结尾。
数据项及顺序:车辆标识,触发事件,运营状态,GPS时间,GPS经度,GPS纬度,GPS速度,GPS方向,GPS状态
车辆标识:6个字符
触发事件:0=变空车,1=变载客,2=设防,3=撤防,4=其它
运营状态:0=空车,1=载客,2=驻车,3=停运,4=其它
GPS时间
GPS经度
GPS纬度
GPS速度:取值000-255内整数,以公里/小时为单位
GPS方位:取值000-360内整数,以度为单位
GPS状态:0=无效,1=有效
结束串:回车符+换行符
数据示例:
123456,0,0,20110414160613,116.4078674,40.2220650,21,274,1