小型数据分析系统的什么样的架构合适?

hainanjianli 2015-07-19 08:44:47
加精
最近遇到一个高端元器件制造厂商 需要建设一套元件质控数据分析系统,项目情况需求是这样的:

1.每天产生的元件质检原始信息记录大概有 3千万条,日志文件1G左右 (质检信息记录 内容比较简单);

2.最低需求 隔天产生 各时间段、 各生产线、 各种质检问题类型 统计报表信息(有限几种纬度 统计数量 百分比 ) 实时性要求不高 ;

3.目前可用数据 来源有 质检系统的日志 相应的 数据库文件。

这样的项目如何架构 ? 请大家 给些建议 。。

是否上大数据平台? 数据库如何选择 ?

传统数据库 如MYsql 是否能驾驭? 数据导入的问题?
...全文
2899 22 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
22 条回复
切换为时间正序
请发表友善的回复…
发表回复
worldchinalee 2018-03-22
  • 打赏
  • 举报
回复
hadoop和mysql
tianfang 2018-03-22
  • 打赏
  • 举报
回复
kettle+mysql足够 每天上传文件,然后用kettle做导入批处理进日临时表(可以采用内存表),统计后(可以用存储过程,kettle也可以做)数据进日报表,月/季度/年报表的中间表,定时跑批处理,生成月/季度/年报表 上大数据平台的优点是可以实时导入数据,实时生成报表。做法是: 日志实时进大数据存储(自己写,或者调用kettle,它也可以用于导入到hive/pig),写mr做数据分析,生成报表。数据一直在大数据平台中,可以做的分析比较多
才子无言 2018-03-22
  • 打赏
  • 举报
回复
实现这个,外包个项目,也就几万
David&Tea 2015-08-11
  • 打赏
  • 举报
回复
有没有考虑oracle?
伊顺鸣 2015-08-05
  • 打赏
  • 举报
回复
真的不错的撒
Inhibitory 2015-08-01
  • 打赏
  • 举报
回复
Hadoop挺合适的。
qq_30268937 2015-07-31
  • 打赏
  • 举报
回复
这是比较典型的大数据模型。
迷林 2015-07-28
  • 打赏
  • 举报
回复
mysql 完全能胜任
arecaiz 2015-07-27
  • 打赏
  • 举报
回复
跟我现在数据量差不多,我们一天可能也就几千万记录。但我们及时性要求比较高。基基本每次写放都有一些读取。我现在做的基本分库,分表,读写分离。一些报表直接在写入时进行计算等。(因为我们数据太大如果直接用统计非常慢)
cattpon 2015-07-25
  • 打赏
  • 举报
回复
MYSQL~
wanzhuanqd 2015-07-23
  • 打赏
  • 举报
回复
帮顶!!!!!!!
laoer_2002 2015-07-23
  • 打赏
  • 举报
回复
learning
blue_water_919 2015-07-23
  • 打赏
  • 举报
回复
好复杂的感觉
cattpon 2015-07-22
  • 打赏
  • 举报
回复
learning~
puler 2015-07-22
  • 打赏
  • 举报
回复
感觉关键也就是分库,跟存储 分析感觉没那么复杂啊
liangtu 2015-07-22
  • 打赏
  • 举报
回复
实时要求不高,分表就行:日表、月表、年表,定时统计。
joyhollo 2015-07-21
  • 打赏
  • 举报
回复
看不明白
加油馒头 2015-07-21
  • 打赏
  • 举报
回复
1、关系型数据可以满足,读写分离 分库分表 2、服务程序每晚上自动跑当天数据,并插入统计分表中 3、系统展示统计分析表中的数据
lost_rivers 2015-07-21
  • 打赏
  • 举报
回复
路过帮顶
oh_Maxy 2015-07-21
  • 打赏
  • 举报
回复
如果你产生的日志,都是供查看用的(没有更新),这是比较典型的大数据模型。 传统MySQL应该也能胜任,只是需要分库、分表,设计上稍微复杂点,但是设计好了,对数据的更新操作也会很高效。

67,550

社区成员

发帖
与我相关
我的任务
社区描述
J2EE只是Java企业应用。我们需要一个跨J2SE/WEB/EJB的微容器,保护我们的业务核心组件(中间件),以延续它的生命力,而不是依赖J2SE/J2EE版本。
社区管理员
  • Java EE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧