社区
下载资源悬赏专区
帖子详情
大数据知识普及.pptx下载
weixin_39821051
2023-01-21 11:30:12
大数据知识普及.pptx , 相关下载链接:
https://download.csdn.net/download/sun13212715744/87366579?utm_source=bbsseo
...全文
3
回复
打赏
收藏
大数据知识普及.pptx下载
大数据知识普及.pptx , 相关下载链接:https://download.csdn.net/download/sun13212715744/87366579?utm_source=bbsseo
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
大数据
知识
普及
.
ppt
x
大数据
知识
普及
.
ppt
x
大数据
知识
普及
35.
ppt
x
大数据
知识
普及
35.
ppt
x
Python编程从零基础到项目实战
同步赠送书籍pdf电子书
下载
,去每一章第一节或第二节课件
下载
。 赠送电子书: Python编程从零基础到项目实践习题答案及分析.pdf Python内置函数案例演示.pdf Python编程从零基础到项目实战-
PPT
.rar 电子书...
大数据
专题.
ppt
x
! 有人预言说未来将会是三分技术,七分数据,得数据者得天下。。。
大数据
专题全文共25页,当前为第1页。 !
大数据
,是当今公众津津乐道的一个热词,人们纷纷在探讨
大数据
所带来的科技进步及所蕴含的巨大价值,甚至有人把
大数据
形容为未来世界的石油,更有人夸张的宣称掌握了
大数据
的人,就可以像上帝一样来俯瞰整个世界。 Big Data, it's more than what you think
大数据
专题全文共25页,当前为第2页。
大数据
,又称巨量资料,指的是所涉及的数据资料量规模巨大到无法通过人脑甚至主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。 近几年,被热炒的
大数据
,不只是指资料,也指这些用来分析、处理巨量资料的新兴科技。 2013年马云卸任阿里集团CEO的职位时曾说,大家还没搞清PC时代的时候,移动互联网来了,还没搞清移动互联网的时候,
大数据
时代来了。
大数据
专题全文共25页,当前为第3页。 你想像不到。。。 到底有多少 这个世界的数据
大数据
专题全文共25页,当前为第4页。 近年来,全球数据存储量呈现爆炸式增长,美国互联网数据中心指出,互联网上的数据每年将增长50%,每两年便将翻一番,目前世界上90%以上的数据是最近几年才产生的。据中为咨询预测,到2020年,全球数据量将达到35ZB(相当约90亿块4TB硬盘容量)。 根据国际数据公司(IDC)的测算,似乎没有足够的磁盘空间存储。 就传统IT 企业来看,其结构化和非结构化的数据增长也是惊人的。2005年企业存储的结构化数据为4EB,到2015年将增至29EB,年复合增长率逾20%。非结构化数据发展更猛。2005年为22EB,2015年将增至1600EB,年复合增长率约60%,远远快于摩尔定律。
大数据
专题全文共25页,当前为第5页。 那么,庞大的数据 到底来自哪里呢????!!
大数据
专题全文共25页,当前为第6页。 据统计,国家图书馆的藏书量有2600万册,如果从数据来看的话,一个家庭一年产生的数据相当于半个国家图书馆的数据总量。 而
大数据
并非现在才出现,比如在古代的人口普查,中国在东汉时期就有几千万人,这显然也是庞
大数据
。
大数据
并不是什么崭新的概念,好几十年前 CERN 的科学家就在处理每秒上看 PB (Peta Bytes)巨量资料。那为什么一直到近几年「
大数据
」这颗塬子弹才爆发呢。 现今要处理的资料量更庞大、资料产生跟处理速度更惊人、资料来源更多样,于是处理、储存大量资料的新技术跟工具快速发展,像是开源软体 Hadoop 跟 NoSQL 资料库。新科技诞生后,开发者跟使用者需要一个专业名词来与之前的科技作出区别,于是「
大数据
」一词因应而生。
大数据
专题全文共25页,当前为第7页。
大数据
的特点 Volume(大量) Velocity(高速) Variety(多样) veracity(真实性) 数据量大、数据种类多、 要求实时性强、数据所蕴藏的价值大。在各行各业均存在
大数据
,但是众多的信息和咨询是纷繁复杂的,我们需要搜索、处理、分析、归纳、总结其深层次的规律。最后是价值,从大量的低质量、低价值的数据中获取
知识
,犹如从大海中捞针,获取数据成本很高,但有待挖掘价值大。
大数据
的挖掘和处理。 从技术上看,
大数据
与云计算的关系就像一枚硬币的正反面一样密不可分。
大数据
必然无法用单台的计算机进行处理,必须采用分布式计算架构。它的特色在于对海量数据进行分布式数据挖掘(SaaS),但它必须依托云计算的分布式处理、分布式数据库(PaaS)和云存储、虚拟化技术(IaaS)。
大数据
的挖掘和处理必须用到云技术。
大数据
专题全文共25页,当前为第8页。
大数据
专题全文共25页,当前为第9页。 科学技术及互联网的发展,推动着
大数据
时代的来临,各行各业每天都在产生数量巨大的数据碎片,数据计量单位已从从Byte、KB、MB、GB、TB发展到PB、EB、ZB、YB甚至BB、NB、DB来衡量。微博留言产生数据,视频产生数据,手机通话产生数据,商品标签产生数据,快递包裹、物品流通产生数据,移动终端和互联网的
普及
更是加快产生数据。 越来越多配备了连续测量、报告运行情况的传感器的设备的出现。几年前,跟踪遥测发动机运行仅限于价值数百万美元的航天飞机。 计算机产生的数据可能包含着关于因特网和其他使用者行动和行为的数据,从而提供了对他们的愿望和潜在需求的有用信息。 使用者自身产生的数据信息。人们通过电邮、短信、微博、QQ等产生的文本信息。 至今最大的数据是音频、视频和符号数据。这些数据结构松散,数量巨大,很难从中挖掘有意义的结论和有用的信息。
大数据
的采集
大数据
专题全文共25页,当前为第10页。 数据采集:ETL工具负责将分布的、异构数据源中
大数据
与人工智能.
ppt
x
大数据
与人工智能
大数据
与人工智能全文共42页,当前为第1页。 提纲 什么是
大数据
大数据
系统 从数据获取价值
大数据
驱动智能
大数据
与人工智能全文共42页,当前为第2页。 什么是
大数据
大数据
与人工智能全文共42页,当前为第3页。 什么是
大数据
老生常谈的4个V 第五个V: Value 10秒的iPhone视频 1980x1080x25x10 =518,400,000像素 是
大数据
吗? 一个Excel表,10,000行 用户A,用户B,转账金额 是
大数据
吗?
大数据
与人工智能全文共42页,当前为第4页。
大数据
的价值来源:全 数据维度 时间、空间维度 跨界 举个例子 个人健康数据 McKinsey, Big data: The next frontier for innovation, competition, and productivity, 2011
大数据
与人工智能全文共42页,当前为第5页。
大数据
的价值体现:小 数据
知识
决策(1bit) 精确(概率) 举个例子 极致的个性化推荐
大数据
与人工智能全文共42页,当前为第6页。
大数据
的价值潜力:智能 语言 视觉 预测 举个例子 语音识别 样本量:3千小时 10万小时 识别率:80% 90% 图片识别 样本量:几万 十亿 识别率:70% 95%
大数据
与人工智能全文共42页,当前为第7页。 (大)数据从哪里来 传感器 制造业、公共事业 手机、PC、手环 摄像头 带宽 40 kbps (2G) 15GB/年 20 Mbps (4G) 计算 Moore's Law 存储 TB级SSD
大数据
与人工智能全文共42页,当前为第8页。
大数据
系统
大数据
与人工智能全文共42页,当前为第9页。 如何处理海量数据 一个关于屏保的的真实的故事… 2003年的知春路… MPI
大数据
与人工智能全文共42页,当前为第10页。 分布式系统的前世今生 应用驱动 数据 硬件驱动 突破约束 人的驱动 聪明人 懒人 高效、容错、易用 1980s,个人电脑
普及
分布式系统采用Client-Server架构 分布式SQL数据库(1979) 网络文件系统(1984) 1990s,数据中心提供商业化系统部署解决方案 P2P分布式架构 网格计算 2000s,社交网络的盛行,海量数据和日志 分布式编程模型MapReduce(2004年) 分布式系统,如Hadoop (2006), Spark (2012) , Hive (2013) NoSQL数据库流行,如Cassandra (2008) 2010s,随
大数据
和人工智能的发展 分布式机器学习系统广泛应用 分布式图数据库被用于
大数据
知识
图谱的处理和分析
大数据
与人工智能全文共42页,当前为第11页。
大数据
系统是一个"操作系统" 数据存储 2个CPU 1-4块硬盘 数据分析 统计 数据存储 100+ CPU 800+ 硬盘 数据分析 统计
大数据
与人工智能全文共42页,当前为第12页。 资源管理 计算、存储、IO
大数据
与人工智能全文共42页,当前为第13页。 文件管理 相同的操作逻辑
大数据
与人工智能全文共42页,当前为第14页。 从文件系统到对象存储 海量非结构化数据 文本、语音、图片 (分布式)文件系统 目录结构 支持大文件 元数据服务器成为瓶颈 对象存储 去中心化 Key-Value 架构 支持小文件 分布式元数据存储
大数据
与人工智能全文共42页,当前为第15页。 数据分析 SQL语法相同 具有同样的可视化 及分析能力
大数据
与人工智能全文共42页,当前为第16页。
大数据
怎么玩 从数据获取价值
大数据
与人工智能全文共42页,当前为第17页。
大数据
的价值获取 Human analytics Machine analytics
大数据
与人工智能全文共42页,当前为第18页。 数据ETL和清洗 HDFS
大数据
与人工智能全文共42页,当前为第19页。
大数据
洞察:群体和个体
大数据
与人工智能全文共42页,当前为第20页。
大数据
洞察:生态和信息传播 设备画像 用户画像 应用画像 核心算法 文本挖掘 机器学习
知识
图谱
大数据
与人工智能全文共42页,当前为第21页。 交互式数据洞察 超越传统BI报表的形式 动态、变化的需求 数据组织形态 实时响应
大数据
与人工智能全文共42页,当前为第22页。 从文本提取结构化
知识
"北京时间8月15日凌晨,2016年里约奥运会跳水女子单人三米板比赛中出现了浪漫的一幕。获得亚军的中国美女何姿在颁奖仪式后收到了男友秦凯的求婚。今天的比赛中,施廷懋以总分406.05分获得冠军,在帮助中国队实现该项目八连冠的同时,何姿以387.90分遗憾获得银牌"。 何姿 秦凯 男友 获得 亚军/银牌 求婚
大数据
与人工智能全文共42页,
下载资源悬赏专区
12,773
社区成员
12,301,699
社区内容
发帖
与我相关
我的任务
下载资源悬赏专区
CSDN 下载资源悬赏专区
复制链接
扫一扫
分享
社区描述
CSDN 下载资源悬赏专区
其他
技术论坛(原bbs)
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章