社区
下载资源悬赏专区
帖子详情
大数据存储与处理-数据流挖掘.pptx下载
weixin_39820535
2023-01-21 10:00:26
大数据存储与处理-数据流挖掘.pptx , 相关下载链接:
https://download.csdn.net/download/sun13212715744/87365906?utm_source=bbsseo
...全文
4
回复
打赏
收藏
大数据存储与处理-数据流挖掘.pptx下载
大数据存储与处理-数据流挖掘.pptx , 相关下载链接:https://download.csdn.net/download/sun13212715744/87365906?utm_source=bbsseo
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
大数据
存储
与
处理
-
数据流
挖掘
.
ppt
x
大数据
存储
与
处理
-
数据流
挖掘
.
ppt
x
大数据
存储
与
处理
数据流
挖掘
.
ppt
x
大数据
存储
与
处理
数据流
挖掘
.
ppt
x
Python编程从零基础到项目实战
同步赠送书籍pdf电子书
下载
,去每一章第一节或第二节课件
下载
。 赠送电子书: Python编程从零基础到项目实践习题答案及分析.pdf Python内置函数案例演示.pdf Python编程从零基础到项目实战-
PPT
.rar 电子书...
大数据
导论-2.1.1-熟悉
大数据
的定义.
ppt
x
《
大数据
导论》 熟悉
大数据
的定义
大数据
导论-2全文共23页,当前为第1页。 所谓
大数据
,狭义上可以定义为:用现有的一般技术难以管理的大量数据的集合。 对大量数据进行分析,并从中获得有用观点,这种做法在一部分研究机构和大企业中,过去就已经存在了。现在的
大数据
和过去相比,主要有三点区别: 第一,随着社交媒体和传感器网络等的发展,在我们身边正产生出大量且多样的数据; 第二,随着硬件和软件技术的发展,数据的
存储
、
处理
成本大幅下降; 第三,随着云计算兴起,
大数据
的
存储
、
处理
环境已经没有必要自行搭建。 一、
大数据
的定义
大数据
导论-2全文共23页,当前为第2页。 所谓"用现有的一般技术难以管理",例如是指用目前在企业数据库占据主流地位的关系型数据库无法进行管理的、具有复杂结构的数据;或者也可以说,是指由于数据量的增大,导致对数据的查询(Query)响应时间超出允许范围的庞
大数据
。 研究机构Gartner给出了这样的定义:"
大数据
"是需要新
处理
模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 一、
大数据
的定义
大数据
导论-2全文共23页,当前为第3页。 麦肯锡说:"
大数据
指的是所涉及的数据集规模已经超过了传统数据库软件获取、
存储
、营理和分析的能力。这是一个被故意设计成主观性的定义,并且是一个关于多大的数据集才能被认为是
大数据
的可变定义,即并不定义大于一个特定数字的TB才叫
大数据
。因为随着技术的不断发展,符合
大数据
标准的数据集容量也会增长;并且定义随不同的行业也有变化,这依赖于在一个特定行业通常使用何种软件和数据集有多大。因此,
大数据
在今天不同行业中的范围可以从几十TB到几PB。" 一、
大数据
的定义
大数据
导论-2全文共23页,当前为第4页。 随着"
大数据
"的出现,数据仓库、数据安全、数据分析、数据
挖掘
等围绕
大数据
商业价值的利用正逐渐成为行业人士争相追捧的利润焦点,在全球引领了又一轮数据技术革新的浪潮。 一、
大数据
的定义
大数据
导论-2全文共23页,当前为第5页。 从字面来看,"
大数据
"这个词可能会让人觉得只是容量非常大的数据集合而已。但容量只不过是
大数据
特征的一个方面,如果只拘泥于数据量,就无法深入理解当前围绕
大数据
所进行的讨论。因为"用现有的一般技术难以管理"这样的状况,并不仅仅是由于数据量增大这一个因素所造成的。 IBM说:"可以用3个特征相结合来定义
大数据
:数量(Volume,或称容量)、种类(Variety,或称多样性)和速度(Velocity),或者就是简单的3V,即庞大容量、极快速度和种类丰富的数据" 。 二、
大数据
的3V和5V特征
大数据
导论-2全文共23页,当前为第6页。 二、
大数据
的3V和5V特征
大数据
导论-2全文共23页,当前为第7页。 (1)Volume(数量) 最初考虑到数据的容量,是指被
大数据
解决方案所
处理
的数据量大,并且在持续增长。数据容量大能够影响数据的独立
存储
和
处理
需求,同时还能对数据准备、数据恢复、数据管理的操作产生影响。如今,
存储
的数据数量正在急剧增长中,我们
存储
所有事物,包括:环境数据、财务数据、医疗数据、监控数据等。有关数据量的对话已从TB级别转向PB级别,并且不可避免地会转向ZB级别。可是,随着可供企业使用的数据量不断增长,可
处理
、理解和分析的数据的比例却不断下降。 二、
大数据
的3V和5V特征
大数据
导论-2全文共23页,当前为第8页。 典型的生成大量数据的数据源包括: (1)在线交易,例如官方在线销售点和网银。 (2)科研实验,例如大型强子对撞机和阿塔卡玛大型毫米及次毫米波阵列望远镜。 (3)传感器,例如GPS传感器,RFID标签,智能仪表或者信息技术。 (4)社交媒体、脸书、推特、微信、QQ等。 二、
大数据
的3V和5V特征
大数据
导论-2全文共23页,当前为第9页。 (2)Variety(种类、多样性) 数据多样性指的是
大数据
解决方案需要支持多种不同格式、不同类型的数据。数据多样性给企业带来的挑战包括数据聚合、数据交换、数据
处理
和数据
存储
等。 随着传感器、智能设备以及社交协作技术的激增,企业中的数据也变得更加复杂,因为它不仅包含传统的关系型数据,还包含来自网页、互联网日志文件(包括单击流数据)、搜索索引、社交媒体论坛、电子邮件、文档、主动和被动系统的传感器数据等原始、半结构化和非结构化数据。 二、
大数据
的3V和5V特征
大数据
导论-2全文共23页,当前为第10页。 种类表示所有的数据类型。其中,爆发式增长的一些数据,如互联网上的文本数据、位置信息、传感器数据、视频等,用企业中主流的关系型数据库是很难
存储
的,它们都属于非结构化数据。 当然,在这些数据中,有一些是过去就一直存在并保存下来的。和过去不同的是,除了
存储
,还需要对这些
大数据
进行分析,并从中获得有用
大数据
与
大数据
技术(1).
ppt
x
量变到质变
大数据
与
大数据
技术 虞强 2016.10
大数据
与
大数据
技术(1)全文共58页,当前为第1页。 议程 公司简介
大数据
与
大数据
技术
大数据
技术应用
大数据
案例分享 问题讨论 Advanced Analytic Service All Rights Reserved 2016 2
大数据
与
大数据
技术(1)全文共58页,当前为第2页。 公司简介 公司概况&发展历史 主要客户&
大数据
产品 Advanced Analytic Service All Rights Reserved 2016 3
大数据
与
大数据
技术(1)全文共58页,当前为第3页。 新加坡 上海 北京 公司概况 青岛 雅加达 专注于分析预测与行业应用的的
大数据
公司 深圳 业务1 业务2 业务3 提供基于
大数据
技术的预测性分析及商务智能解决方案
大数据
平台、数据集成与准备工具、开源开发技术 自助式分析工具、数据可视化工具 提供全球顶尖的
大数据
软件产品 300+ 技术服务人员 端到端的
大数据
平台 数据集成、数据
挖掘
与预测性分析、高级分析 企业级
大数据
仓库、企业绩效管理、商务智能
大数据
SaaS应用和DaaS服务 基于云平台的软件即服务
大数据
应用 为企业提供全面的数据服务
大数据
与
大数据
技术(1)全文共58页,当前为第4页。 发展历史 数据仓库 绩效管理 高级分析 数据可视化 看板管理 商务智能2.0 至今 2005 2007 2011 2002
大数据
技术
大数据
应用 分析预测 数据
挖掘
数据即服务 数据集市 14年来, 我们与数俱进
大数据
与
大数据
技术(1)全文共58页,当前为第5页。 汽车制造 · 电子产品及家电 · 快消零售 · 医药与生命科学 · 航空与物流 · 高科技制造业 · 金融及其他 主要客户
大数据
与
大数据
技术(1)全文共58页,当前为第6页。 云 以 H a d o o p 为核心的
大数据
产品系列 数据集成与准备 SQL on Hadoop Text here 流计算 机器学习 开源开发技术 数据
挖掘
以 H a d o o p为核心的
大数据
产品
大数据
软件产品 Statistica 数据 可视化 Vortex
大数据
与
大数据
技术(1)全文共58页,当前为第7页。 数据 创新 经验 融合 拥有多元化的数据科学家团队和十余年的数据分析经验。经十余年自主开发的IP打造数据行业领先的技术优势。 追踪吸收和引进行业内最先进的技术,产品和应用经验。世界顶尖数据技术公司在中国地区的首选合作伙伴。 在一大批竞争行业(汽车、制药、快消、家电、物流等)内拥有深厚的客户基础和众多行业成功案例。 追求行业业务能力和技术能力的融合以及企业系统架构与解决业务问题间的平衡,具有扎实的项目实施能力。 HEADLINE 竞争优势
大数据
与
大数据
技术(1)全文共58页,当前为第8页。 Advanced Analytic Service All Rights Reserved 2016 9
大数据
与
大数据
技术
大数据
与
大数据
技术(1)全文共58页,当前为第9页。 Hadoop技术的发展 物联网应用需要将Hadoop变为一个高性能的分析平台 需要Hadoop不光能
存储
数据,更要能够
处理
计算数据
大数据
与
大数据
技术(1)全文共58页,当前为第10页。 SQL 分析
挖掘
预测 图形化数据分析 智能搜索 时间、用户、地理位置、事件 等标签 辅助技术: Kafka, HBase, Cassandra, Accumulo 基于
大数据
技术的数据分析
处理
Hadoop 核心层 数据准备
大数据
与
大数据
技术(1)全文共58页,当前为第11页。 技术更迭过快 开源产品成熟度 开发效率 与现有架构的关系 运维与安全
大数据
技术的顾虑 ?
大数据
与
大数据
技术(1)全文共58页,当前为第12页。
大数据
平台计算框架 传统数仓功能 非结构化流式
挖掘
分析
大数据
与
大数据
技术(1)全文共58页,当前为第13页。 软件架构 (举例) DATA PLATFORM(HDFS) 灵活数据准备 SQL in Hadoop 数据
挖掘
与预测 S Q L(ODBC、JDBC、、。NET) API:Java, C/++, Python 前端应用 报表 外部应用 下游系统 管理控制台 (CloudEra、Talend、KNIME) 数据安全以及认证(Portal集成)
大数据
与
大数据
技术(1)全文共58页,当前为第14页。 用工具取代代码作坊 MapReduce Performance (runs on disk) One Click Spark Performance (runs in-memory & on disk) 20X Faster
大数据
与
大数据
技术(1)全文共58页,当前为第15页。 同时
处理
实时与批次 流式
处理
下载资源悬赏专区
12,781
社区成员
12,309,441
社区内容
发帖
与我相关
我的任务
下载资源悬赏专区
CSDN 下载资源悬赏专区
复制链接
扫一扫
分享
社区描述
CSDN 下载资源悬赏专区
其他
技术论坛(原bbs)
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
暂无公告
试试用AI创作助手写篇文章吧
+ 用AI写文章