有时候觉得你像黄蓉,又像百灵鸟。 我喜欢黄蓉,也喜欢百灵鸟。

m0_71155214 2023-05-29 23:16:02

有时候觉得你像黄蓉,又像百灵鸟。 我喜欢黄蓉,也喜欢百灵鸟。

...全文
3 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
大数据能否取代统计学?全文共6页,当前为第1页。大数据能否取代统计学?全文共6页,当前为第1页。大数据能否取代统计学? 大数据能否取代统计学?全文共6页,当前为第1页。 大数据能否取代统计学?全文共6页,当前为第1页。 以Google公司的崛起为标志的智能时代,如滚滚的历史车轮,一圈一圈、有条不紊地改变着我们的生活。 信息技术发展到今天,已经从根本上改变了工业革命和机械时代留给我们的思维方法和体系。 即使是明天一早发现无人驾驶汽车像mobike一样如雨后春笋般出现在路上,我们所能感叹的,可能也只不过是一句:这一天终于来了! 1 老问题,新看法 Google从最初有做无人驾驶汽车的想法开始,到做出像模像样的原型车,只用了4年时间。 截止2016年,Google研制的无人驾驶汽车的总行驶里程已经达到了200万英里,相当于一个人类司机300年的里程。 其实说来很奇怪,为什么站在风口浪尖上的不是奔驰宝马特斯拉这样的汽车公司,而是Google这样一个搞搜索引擎的公司呢? 其实之前我们已经讨论过了:智能时代的核心是大数 ,而大数据的核心是如何将传统的模型驱动转化为智能的数据驱动,然后用海量数据的优势去弥补复杂模型暂时不能达到的精确度。(98%的人无法跨越的认知鸿沟) 跟语音识别和智能翻译一样,无人驾驶汽车本质上也是一个人工智能的问题,只要数据充足,就可以把智能问题转化成数据问题。 下围棋的AlphaGo赢李世友,靠得是海量棋谱和搜索算法;同理,大数据能否取代统计学?全文共6页,当前为第2页。大数据能否取代统计学?全文共6页,当前为第2页。Google无人驾驶汽车靠得是"街景"功能"扫街"扫来的大量道路信息。 大数据能否取代统计学?全文共6页,当前为第2页。 大数据能否取代统计学?全文共6页,当前为第2页。 对于没有扫过的陌生区域,无人驾驶基本上是束手无策的。 今天,二郎想换一个全新的角度去剖析和对比大数据和其他思维背后暗含的意义,以及郭靖和黄蓉又是如何融会贯通并且践行的。 2 统计学 vs 大数据 先来看看大数据跟统计学有何冲突。 统计学是人类解决与大量数据相关问题时所发明的一种实用数学工具。 一些比较严谨的统计学教材会将统计学分为描述统计学 (Descriptive Statistics) 和推论统计学 (Inference Statistic) 两大类依次介绍。 其中描述统计学约占20%的篇幅,主要内容是如何描述获得的数据,比如算个平均值、中位数,画个直方图之类的。 而推论统计学约占80%的篇幅,讨论怎样才能从局部样本的特性推测出全体特性,包括正态分布、各种(非)参数检验,是广大学子最头疼的部分。 我们通常所说的"统计分析",主要指推论统计学。 统计学的本质,可以用一句话总结:当研究对象的数据量大到无法穷举时,我们只能使用"采样"这样一种妥协的方法,尽量有代表大数据能否取代统计学?全文共6页,当前为第3页。大数据能否取代统计学?全文共6页,当前为第3页。性地替代全体样本。 大数据能否取代统计学?全文共6页,当前为第3页。 大数据能否取代统计学?全文共6页,当前为第3页。 统计学的思路是先从个体(样本)入手,达到统计数据,然后推论出群体(全集)的特性,再将群体的特性当成一般规律,应用在其他非样本的个体身上。 而大数据想到达到的精准境界,比如精准医疗、精准扶贫,正好站在了统计学概率思维的对立面上。 大数据的终极形态应该是穷举法,利用数据的完备性绕过局部样本和统计规律,直接给出精准的个体信息。 比如说,黄蓉和郭靖都想打探洪七公喜欢吃什么菜,但他俩所用的方法却截然不同。 黄蓉选择了统计学,亲自下厨给洪七公烹制"川鲁粤苏,闽浙湘徽"的各种菜品,然后直接问洪七公的评论和反应,不出两个礼拜,就能有95%的把握说自己已经把洪七公的饮食喜好摸清楚了。 郭靖选择了大数据,他没有手艺,只能用勤能补拙的屌丝方法,每天把洪七公吃了什么菜记在本子上,即使别人请吃饭时的菜不能真实反映洪七公的喜好,但坚持一年下来,也能摸个七八成。 Anyway,黄蓉和郭靖各自的方法都能达到"打探洪七公喜欢吃什么菜"的最终目的,皆大欢喜。 大数据能否取代统计学?全文共6页,当前为第4页。大数据能否取代统计学?全文共6页,当前为第4页。 大数据能否取代统计学?全文共6页,当前为第4页。 大数据能否取代统计学?全文共6页,当前为第4页。 3 天才 vs 勤奋 我们一般都会认为穷举法(也叫枚举法)是笨方法。例如,对于一个同时包含数字和大小写字母的8位密码,如果用工作站,大概需要25天的时间才能破解,即使用1秒钟可以试10亿次密码的超级计算机,也得用60个小时。 但是,当黑客没有更好的算法来破解密码是,或许用一个高性能电脑或者工作站跑一个月这种笨方法,反而是最省事的选择。 笨办法只是郭靖的首

249,038

社区成员

发帖
与我相关
我的任务
社区描述
欢迎加入几何心凉的前端社区,本社区活动丰富可以拿到众多周边礼物,本社区还对接Vue技能树可以更加系统的进行学习,还为大家定期举办博主成长计划,助您赢在CSDN同时带您遨游在前端技术的海洋中!!
前端学习经验分享 个人社区 北京·丰台区
社区管理员
  • 几何心凉
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

诚挚的邀请大家加入几何心凉社区,在这里您可以结实挚友、提升技术、分享经验、成就自己

  • 【社区活动】本社区受官方长期扶持,您可以通过活动打造个人IP,让更多的人受益于您的分享,同时我们还会奉上精美周边;
  • 【赢在CSDN】社区会对社区成员开设博主扶持计划,集结优质博主分享成长经验,更是疑问在线解答,定期直播连麦,只要您是本社区成员皆可免费享受此权益,让我们携手共进助您速获万粉头衔;
  • 【Vue技能树】本社区创建人同时作为Vue技能树构建者,可为本社区开设技能树投稿通道,获得此权益后我们的高质量的文章被技能树收录获得更多曝光机会;
  • 【简历/就业指导】本社区创建者目前兼职高校就业指导,如果您是学生准备找工作或者您是职场人在应聘中遇到任何问题都可以在这里寻求帮助,我们会定期开设简历审查、面试技巧等就业方面的直播讲解;
  • 【技术交流】任何语言任何方向的技术文章我们都可以汇聚于此,大家可以摸鱼时间可以来此处提升自己,遨游在技术的海洋中;
  • 【立码吐槽】不管你是学生还是打工人,相信在生活中肯定有不断的新鲜事发生,这些事情可以是令你高兴的(比如今天过生日)可以是伤心的(比如我们丢了一个发卡)当然还会有很多,不满、发泄、求安慰等等,那么你可以在这个专栏中做出分享,求一句生日快乐、上岸顺利、加油老铁等等暖心的话;相信我们社区的伙伴看到后一定会速来吐槽;
  • 【bug记录】开发中的坑、学习中的雷,我们皆可投递于此,让更多的人借着分享精准避免从而高效开发;
  • 【更多】更多专栏正在筹备中。。。如果您是社区成员、如果您想为社区建设贡献力量,可以私聊社区管理员;

试试用AI创作助手写篇文章吧