1. 首页
  2. R语言

【涨姿势】绝不装逼的大数据科普(一)

那就从去年9月说起,花正好, 月正圆的时候,桑尼在西班牙巴塞罗那听过一个大数据的课程(是的,您没看错,我跑去建筑鬼才高迪的城学习大数据。。。)

那个西班牙叫兽长得还蛮帅的,教得实在是不怎么样,比如,他用了这样一张图来说明大数据的趋势-




这算是个什么毛线大数据啦??!!(长得也的确像个毛线。。。)

再比如,他说大数据就是从千字节(1000)到尧字节(1000000000000000000000000)时代的转变。。。谁能把这串数字用英文念出来,我给你中国达人秀的编导电话哦亲

【涨姿势】绝不装逼的大数据科普(一)


此处友情提示:以后不管在公司茶水间,老板会议室,闺蜜下午茶等等场合,要和人家表示你很懂大数据,千万不要像这位叫兽一样用数据来表示!一下子就low掉了好吗?要从思维和商业模式的改变来谈才比较洋气哦。

当然叫兽也不是一无是处,比如他用的这张图就有那么点意思了,以下是大数据技术分析出的美国NBA球员场上投篮和得分概率分析。

【涨姿势】绝不装逼的大数据科普(一)


这才终于说出了大数据的意义呢,当当当拉开我的大数据科普序幕。

大数据科普1:只问“是什么”,不问“为什么”

如果有人爱你,你只需要知道他(她)爱你,是不是一定要知道他(她)为什么爱你呢?不一定吧。
大数据也是同样的机制。

虽然在小数据时代,相关关系也能通过假设体现,但到了大数据时代,相关关系(而非因果关系)基于庞大而全面的数据样本大放异彩。

简单说来,就是如果事件a和事件b常常一起发生,一旦a发生了,大数据就可以预测b也要发生了。

但是a和b到底是什么基友关系,who cares?也没有人能告诉你。

大数据是为了你的目的发挥作用的,不要去打破砂锅问到底了。你是不是一定要去问kobe bryant为什么你在右边的投篮命中率比较高呢,他估计自己也不造吧,你要做的就是尽量不要让他在这个区域出手啊!

大数据科普2:大数据时代,数据越多越好吗?

当然不是。

虽然大数据已经让整个商界变得很浮夸,但很多大数据和预测分析的案例都表明,更多的数据未必带来正面的业务影响

对于各位商界精英以及数据分析师来说,重要的不是如何分析所有的数据,而是基于自己的商业模式先认真考虑一下-通过哪些数据可以得出真正有价值的结果。因为过多的数据不会带来本质的不同,反而会让自己陷入雾里看花之中。

打个很恰当的比方,你和一个人谈恋爱,是不是知道他(她)的事情越多越好呢?要是你和吴彦祖(女读者看这里)或者林志玲(男读者看这里)在一起,他们是跨国通缉犯(假设)的事情你知道后反而会陷入不必要的混乱呢。。。你们说是不是这么个道理?

所以相信我吧少年,大数据就是这么叫而已。“相关数据”的“相关关系”本身,已经足够我们很好滴了解这个世界了。

ps.如果大家喜欢我也可以谈谈对热门BIG书籍-《大数据时代》的看法。我和作者维克多那(yi)么(mian)熟(zhi)了(yuan),吐槽就更不用客气了~~


更有用的【绝不装逼的大数据科普(二)】,请听下回分解。

作者:桑尼潘

原文始发于微信公众号(PPV课数据科学社区):【涨姿势】绝不装逼的大数据科普(一)

原创文章,作者:ppvke,如若转载,请注明出处:http://www.ppvke.com/archives/29486

联系我们

4000-51-9191

在线咨询:点击这里给我发消息

工作时间:周一至周五,9:30-18:30,节假日休息