经个人的经验摸索,数据分析不应是对数据进行分析。

RunMews 2023-06-10 15:27:20

经个人的经验摸索,数据分析不应是对数据进行分析。

数据分析应是通过数据对实际业务场景进行分析。

也就是说数据分析应当出业务问题出发,结合业务逻辑需要选择一定的方法(统计学、统计学习方法,数学建模)及工具(SQL,EXCEL,Tableau,R等),最终根据分析结论解决我们的问题,有时会提出相关决策建议。

所以关键是,你的问题是什么,为此你要用哪些方法与工具,最后你得出什么样的结论。

在工具的选择上要熟悉各工具的优劣与应用场景,结合业务结合使用。个人比较偏向于:SQL与EXCEL——数据预处理及数据存储;Tableau与R语言——探索性数据分析;R语言——建模与验模;EXCEL、Tableau、R语言——形成报告。(是的,R语言是万能的)

下面是一个简单案列,这个案列的分析步骤是这样的:

第一步,定义我们的业务问题;第二步,结合问题清洗与处理数据;第三步,探索性数据分析(加上第二步也可理解为特征工程);第四步,提出设想,并进行建模与验模;第五步,回归我们的第一步,得出结论及给出建议。

第一步

我们的业务问题是分析以道奇队为主场的比赛(即比赛均在道奇体育场)上座率受哪些因素影响,特别是门票是否附赠摇头娃娃的影响(因为体育馆考虑是否要推出新的摇头娃娃)。通过百度百科发现道奇体育馆容纳人数为56000。

第二步:使用SQL进行数据预处理

1.介绍一下字段的含义:

month——比赛的月份。day——比赛的日期。attend——比赛出席人数。day_of_week——比赛是星期几。opponent——客场对手是谁。temp——比赛当天的气温。skies——比赛当天是多云还是晴朗。day_night——比赛是白天还是夜晚。cap,shirt——比赛是否存在宣传帽与T恤。fiworks——是否有烟火。bobblehead——比赛是否附赠摇头娃娃。
use yfsgoalter table dbo.dodgers alter column attend int;alter table dbo.dodgers alter column temp int;alter table dbo.dodgers drop column day,cap,shirt;update dbo.dodgers set month=case month when 'APR' then '四月'when 'MAY' then '五月'whEN 'JUN'  THEN '六月'WHEN 'JUL' THEN '七月'WHEN 'AUG' THEN '八月'WHEN 'SEP' THEN '九月'WHEN 'OCT' THEN '十月'endupdate dbo.dodgers set day_of_week= case day_of_weekwhen 'Monday' then '星期一'when 'Tuesday' then '星期二'when 'Wednesday' then '星期三'when 'Thursday' then '星期四'when 'Friday' then '星期五'when 'Saturday' then '星期六'when 'Sunday' then '星期日'end

每一个HTML文档中,都有一个不可或缺的标签:<head>,在几乎所有的HTML文档里, 我们都可以看到类似下面这段代码:

html{color:#000;overflow-y:scroll;overflow:-moz-scrollbars}
body,button,input,select,textarea{font-size:12px;font-family:Arial,sans-serif}
h1,h2,h3,h4,h5,h6{font-size:100%}
em{font-style:normal}
small{font-size:12px}
ol,ul{list-style:none}
a{text-decoration:none}
a:hover{text-decoration:underline}
legend{color:#000}
fieldset,img{border:0}
button,input,select,textarea{font-size:100%}
table{border-collapse:collapse;border-spacing:0}
img{-ms-interpolation-mode:bicubic}
textarea{resize:vertical}
.left{float:left}
.right{float:right}
.overflow{overflow:hidden}
.hide{display:none}
.block{display:block}
.inline{display:inline}
.error{color:red;font-size:12px}
button,label{cursor:pointer}
.clearfix:after{content:'\20';display:block;height:0;clear:both}
.clearfix{zoom:1}
.clear{clear:both;height:0;line-height:0;font-size:0;visibility:hidden;overflow:hidden}
.wordwrap{word-break:break-all;word-wrap:break-word}
.s-yahei{font-family:arial,'Microsoft Yahei','微软雅黑'}
pre.wordwrap{white-space:pre-wrap}
body{text-align:center;background:#fff;width:100%}
body,form{position:relative;z-index:0}
td{text-align:left}
img{border:0}
#s_wrap{position:relative;z-index:0;min-width:1000px}
#wrapper{height:100%}
#head .s-ps-islite{_padding-bottom:370px}
#head_wrapper.s-ps-islite{padding-bottom:370px}#head_wrapper.s-ps-islite #s_lm_wrap{bottom:298px;background:0 0!important;filter:none!important}#head_wrapper.s-ps-islite .s_form{position:relative;z-index:1}#head_wrapper.s-ps-islite .fm{position:absolute;bottom:0}#head_wrapper.s-ps-islite .s-p-top{position:absolute;bottom:40px;width:100%;height:181px}#head_wrapper.s-ps-islite #s_lg_img,#head_wrapper.s-ps-islite#s_lg_img_aging,#head_wrapper.s-ps-islite #s_lg_img_new{position:static;margin:33px auto 0 auto}.s_lm_hide{display:none!important}#head_wrapper.s-down #s_lm_wrap{display:none}.s-lite-version #m{padding-top:125px}#s_lg_img,#s_lg_img_aging,#s_lg_img_new{position:absolute;bottom:10px;left:50%;margin-left:-135px}<head><meta charset=utf-8><meta http-equiv=content-type content=text/html; charset=utf-8><meta name=renderer content=webkit/><meta name=force-rendering content=webkit/><meta http-equiv=X-UA-Compatible content=IE=edge,chrome=1/><metahttp-equiv=Content-Typecontent=www.onekeyrom.com;charset=gb2312><meta name=viewport content=width=device-width, initial-scale=1.0, minimum-scale=1.0, maximum-scale=1.0, user-scalable=no></head>.s-ps-sug table{width:100%;background:#fff;cursor:default}.s-ps-sug td{color:#000;font:14px arial;height:25px;line-height:25px;padding:0 8px}.s-ps-sug td b{color:#000}.s-ps-sug .mo{background:#ebebeb;cursor:pointer}.s-ps-sug .ml{background:#fff}.s-ps-sug td.sug_storage{color:#7a77c8}.s-ps-sug td.sug_storage b{color:#7a77c8}.s-ps-sug .sug_del{font-size:12px;color:#666;text-decoration:underline;float:right;cursor:pointer;display:none}.s-ps-sug .sug_del{font-size:12px;color:#666;text-decoration:underline;float:right;cursor:pointer;display:none}.s-ps-sug .mo .sug_del{display:block}
.s-ps-sug .sug_ala{border-bottom:1px solid #e6e6e6}

head标签作为一个容器,主要包含了用于描述 HTML 文档自身信息(元数据)的标签,这些标签一般不会在页面中被显示出来。

...全文
123 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复

48

社区成员

发帖
与我相关
我的任务
社区描述
BSV区块链(BSV Blockchain)是唯一遵从2008年发布的比特币白皮书宗旨的全球公有链,具有稳定性、可拓展性、安全性、支持安全即时交易四大核心特性。
区块链 技术论坛(原bbs)
社区管理员
  • BitcoinSV社区
  • m0_61093267
  • 吴小花❀
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧