一文说清楚模型数据从何而来

motangup 秀才 2021-11-16 16:28:18

模型对于很多人来说是一个黑匣子,充满神秘性和未知性。所以,即便是模型创建者将模型公开,也会因为创建者和使用者专业能力和知识背景的不同,使两者之间出现信息不对称的情况,使用者自然也就不知道为什么会选用这种解决方法,也就是说,创建模型的人可能不知道此种模型效果好不好,而使用模型的人也不知道该怎么去反馈使用的结果。这样一来,这种信息不对称会越来越严重。

这一问题恰恰体现了大数据实践中非常严重的断层问题。收集数据的人不知道将来的人怎么使用数据,创建模型的人不知道自己所采用的数据在未来是否稳定,使用模型的人不知道整个数据的来路或者加工过程,这些都是普遍存在且很现实的问题。

从公司管理层的角度来看,投资人了解数据的意义是什么?高层管理者对数据的期望和中层管理者之间又有什么不同?他们知道数据能帮企业做什么吗?这些问题的答案完全会因立场不同而异。中层管理者大都不知道数据能帮助他们做什么,他们没有管理者的视角。相比之下,你只需要告诉他们数据能解决什么问题即可。相反,数据分析师可能就会更加迷惑不解,我做了这么多东西,为什么你们不用?

每个层级和功能部门都是一个断层,而且对于数据价值的内在衡量都不一样。所以,当我们讲到数据价值时,没有人能对此给出一个合理的定位,原因就在于有几个关键问题没有区分清楚,一事要明确这是谁心里的数据价值。投资人、高层管理者、中层管理者、数据分析师各自心中对数据的价值自然不同,二是要明确数据的分类,不同类型的数据所产生的价值各不相同。为什么我们在大数据应用方面存在障碍?一个重要的原因在于应用人员对于数据价值和数据分类没有明确的界定。

在当下的大数据环境里,数据其实与商业模式密不可分,每个人都认识到它的经济价值是巨大的,但今日的大数据发展趋势之快,对于很多公司来说变得更加虚无缥缈,难以把控,让每个人抓狂,让每个人手足无措。

而在这一方面,阿里巴巴已经对数据化运营做了不少有益的尝试,淘宝一直致力于一件事,用数据来帮助企业运营和解决问题。但在不断使用数据的同时,也发现了数据本身的问题,大数据需要更主动地管理,也需要更多的创新。

数据化运营就是用数据去解决问题,但是如果我们想把数据做得更好,解决更多新的问题,就需要去做一件以前未曾做过的新事情,运营数据。对于阿里巴巴来说,这件事情是从2011年才有计划的进行的,企业主动收集数据,并且以此去创造更优质的新数据,让新数据更好地服务于企业的运营。这是一个从用数据到养数据的过程,一个从数据化运营到运营数据的过程,也是一个从看到真用的过程。

从数据化运营到运营,数据是一个闭环,今天的电商企业正走到了其中的一个节点。在经历了起初大数据的喧嚣之后,大家终于感受到要使大数据产生真正的商业价值,我们要关注的内容并非4V那么简单,而应该将焦点放在如何真正让数据落地之上,即从数据化运营到商业管理能力的提升。

转自:数据与智能

...全文
341 1 打赏 收藏 转发到动态 举报
写回复
用AI写文章
1 条回复
切换为时间正序
请发表友善的回复…
发表回复
喜酱的探春 秀才 2021-11-16
  • 打赏
  • 举报
回复
666

68,003

社区成员

发帖
与我相关
我的任务
社区描述
汇集数据库的爱好者和关注者,大家共同学习、探索、分享数据库前沿知识和技术,像松鼠一样剥开科学的坚果;交流Gauss及其他数据库的使用心得和经验,互助解决问题,共建数据库技术交流圈。
数据库数据仓库 企业社区 北京·海淀区
社区管理员
  • Gauss松鼠会
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

欢迎大家同时关注Gauss松鼠会专家酷哥。

https://www.zhihu.com/people/ku-ge-78-98

试试用AI创作助手写篇文章吧