到底什么叫大数据~

lucklover 2013-06-04 10:36:24
最近在看小日本伊藤直也 田中慎司的书.发现干货很多啊.
上来第一篇就提出来啥叫大数据.


各位大牛~ 到底啥叫大数据? 我觉得这个是相对的概念吧.

或者各位谁还有网站结构方面的书能推荐给小弟吗.

我知道这是个水贴~ 所以大侠们尽情来水吧
...全文
1192 15 打赏 收藏 转发到动态 举报
写回复
用AI写文章
15 条回复
切换为时间正序
请发表友善的回复…
发表回复
柳晛 2013-07-18
  • 打赏
  • 举报
回复
不过说真的,不知道他们具体业务如何,这么小的量居然用了500+服务器,是很浪费。
柳晛 2013-07-18
  • 打赏
  • 举报
回复
引用 12 楼 chow__zh 的回复:
故名思议,大量数据,推荐使用oracle数据库
oracle是处理小数据的,大数据应该在架构策略上来存储和计算,而不是依赖某个工具。 大数据,我的理解就是关系型数据库永远都搞不定的数据。 大并发,我的理解是突破硬件瓶颈,也就是说无论多少台硬件,如果没有好的架构,即便全世界的计算机都是你的,也无法突破的瓶颈。
异常异长 2013-07-18
  • 打赏
  • 举报
回复
hadoop 诞生的原因吧
技术笔记本 2013-07-17
  • 打赏
  • 举报
回复
大数据就是全部数据,而不是抽样数据 读一读《大数据时代》
AlexChowKey 2013-07-17
  • 打赏
  • 举报
回复
故名思议,大量数据,推荐使用oracle数据库
Allen_Oscar 2013-07-17
  • 打赏
  • 举报
回复
用云计算处理的
飞舞的锄头 2013-07-16
  • 打赏
  • 举报
回复
就是很大一坨数据,关键是怎么处理效果最好
小小二子 2013-07-16
  • 打赏
  • 举报
回复
大数据,没有一个具体的定义吧。。建议楼主去看百度词条。。。自己问度娘,那个说的也挺不错的。
ccl_only 2013-07-03
  • 打赏
  • 举报
回复
我在XX银行,银行3亿多客户,对于某些业务,每月产生的交易是40亿左右,这个应该算大数据吧
mrslikelin 2013-06-27
  • 打赏
  • 举报
回复
引用 5 楼 sky663 的回复:
好像也不对,这 430Mbps到底是服务器上行还是下行速率
他那样算下来 每秒 千吧 几千条 并发数据(不包括图片) 这个感觉是有点耗服务器了 莫非是它服务器差 还是 我对服务器开练还不够熟(那就水吧)
Cynthea 2013-06-05
  • 打赏
  • 举报
回复
大数据时代到来了。。 我觉得大数据表面意义就是大量而且庞大到你无法想象形容有多大;大数据的最终用途是在其中挖掘有价值的信息。 可以去看看CCTV2台上的《对话》栏目,其中有两期是讲大数据,1、谁在引爆大数据,2.谁在掘金大数据
sky663 2013-06-05
  • 打赏
  • 举报
回复
这就叫大数据呀。 430Mbps 500台服务器??? 现在想想我的300w+/天的物流数据实时监控系统。才用两台服务器。我为公司节约了多少台服务器
sky663 2013-06-05
  • 打赏
  • 举报
回复
好像也不对,这 430Mbps到底是服务器上行还是下行速率
sky663 2013-06-05
  • 打赏
  • 举报
回复
引用 3 楼 tntzbzc 的回复:
[quote=引用 1 楼 sky663 的回复:] 这就叫大数据呀。 430Mbps 500台服务器??? 现在想想我的300w+/天的物流数据实时监控系统。才用两台服务器。我为公司节约了多少台服务器
看清楚是Mbps,每秒430MB的数据量 你那两台机器一天出来300W条数据,按一条数据是1K计算 它每天处理的数据量是你的12861倍 但它的机器数量只有你的250倍(500除以2) 如果用的系统去处理海量数据,假设性能是按线性增长的 你的系统需要25362台机器,你为公司浪费了50倍台服务器 [/quote] 呵呵,300W 是数据库中的数据增长量,不是并发访问的流量。 其实这个没什么可比性。实时监控可能对后台数据的计算量比它大(我说的是可能,别钻牛角哦),前台的并发访问是没有它这个这么大的。 430Mbps 这个东西只是一个速率。若是一个游戏下载类的网站,这个值很容易就上去了,也承载不了多少并发用户。若只是普通网页类的网站,按这个速率估计,并发用户就比较大了。按请求一个网页150K的数据算,(430*1000*1000)/8/(150*1024) = X ,这个X是这一秒钟内能响应的请求数,如果网页有大量图片的话,远不止150K 所以这玩意儿没啥好比的,也没啥好说的
撸大湿 2013-06-05
  • 打赏
  • 举报
回复
引用 1 楼 sky663 的回复:
这就叫大数据呀。 430Mbps 500台服务器??? 现在想想我的300w+/天的物流数据实时监控系统。才用两台服务器。我为公司节约了多少台服务器
看清楚是Mbps,每秒430MB的数据量 你那两台机器一天出来300W条数据,按一条数据是1K计算 它每天处理的数据量是你的12861倍 但它的机器数量只有你的250倍(500除以2) 如果用的系统去处理海量数据,假设性能是按线性增长的 你的系统需要25362台机器,你为公司浪费了50倍台服务器

25,980

社区成员

发帖
与我相关
我的任务
社区描述
高性能WEB开发
社区管理员
  • 高性能WEB开发社区
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧