1. 首页
  2. 数据分析

为什么要警惕《未来简史》中的数据主义?

为什么要警惕《未来简史》中的数据主义?

作者:Han Hsiao 来源: https://zhuanlan.zhihu.com/p/25485539知乎

FBI WARNING!本文有部分剧透!

过去人类面临的三大难题——控制饥荒、瘟疫、战争。

摆在人类面前的新三议题——获得永生、幸福、神圣。

一、圣子降临

达尔文提出《进化论》的150年后,生命科学研究认为,假设生物体都是算法,那么生命就是数据处理的过程,换言之,人是由「数据」构成的。

而研究显示,过去几年中人类制造的数据占整个人类历史数据量的95%,换言之,大数据时代已经真正降临(详见:大数据最核心的价值是什么?)。

通读全书后,作为一名数据研究者,很荣幸,Harari将最后一章留给了数据——信数据得永生。他察觉到,或者说大部分人都察觉到了,大数据正在全面改造人类的思维方式及生活方式

  1. 因为数据流动量过大,人类无法将数据转化为信息,更不用说知识和智能。

  2. 分散式数据处理的效果比集中式数据处理更好(如市场经济和计划经济)。

  3. 民主与专制,本质上即两套不同的数据分析和信息收集的对立机制。

  4. 人类逐渐放弃直觉和经验,选择相信大数据的决策和分析 。

以上结论很容易理解。我们都知道,人类大脑的容量是有限的。而大数据,是建立在海量「历史行为」和「前人经验」上,对未来的一种洞察。人类更倾向于相信大多数人的选择,这是一种无可厚非的,符合生物本能的「自我保护机制」。比如,出行时我们通常会选择地图导航给出的最佳路线,网上购物时我们通常会选择销量最好的商品等。人类生活已经愈发离不开以大数据为基础的AI技术。

二、新世纪宗教

作者对21世纪新的宗教——「数据主义」进行了定义。数据主义者认为,宇宙是由数据组成,任何现象或实体的价值就在于对数据处理的贡献。有了更好的算法和数据,人类这种生物算法就会被自然淘汰,数据主义者信仰两条诫命:

  1. 第一诫命:要链接更多的媒体,产生更多的信息。

  2. 第二诫命:要将万物接入系统,异端也不能例外。

接着笔锋一转,开始对「数据主义」进行了暴风雨般的批判:

  1. 信仰数据主义意味着:放弃隐私、自主性和个别性。

  2. 数据主义对人类产生了威胁:不在乎我们的主观需求。

  3. 数据主义已经从中立的科学理论演变成判别是非的宗教。

  4. 数据主义者认为一切皆数据,全人类是单一的数据处理系统。

  5. 庞大的算法(如Google搜索引擎),没人能够理解其全部的要义。

  6. 机器学习和人工神经网络等「种子算法」会找出人类无法预见的东西。

  7. 批判数据主义,将成为21世纪最大的挑战及最迫切的政治和经济问题。

咋一看,某些言论有点危言耸听。反思之后发现,现实之中,确实存在两派人马:

  • 技术万能派——喜欢研究各种新技术和工具,信仰「万物皆数」,技术发展决定业务导向。在他们眼中,「要么数字化,要么死亡」,一切都可以用数字来解释。


  • 业务万能派——喜欢研究各种话术和营销学,信仰「情感交流」,技术仅仅是为业务服务的。在他们眼中,DA&&DM只是一种工具,属于所用的众多工具的一种。

相信作者批判的类型应该是前者,个人信仰不同,这里不谈对错,只谈利弊。

大数据,「大」字确实重要,但是远没有很多人想象的那么重要。打个不太恰当的比方,海洋里的水非常多,但是我们无法直接饮用,需要提纯和净化。数据亦是如此,高质量的数据非常宝贵,而清洗和筛选的过程决定了数据质量的好坏,但过滤后留下的不一定是「金沙」,也可能是泥沙,数据唯有结合实际业务指标,才能真正理解、判断其真正的价值

大数据,「数」不会说谎,Numbers don’t lie,使用数据的人才会说谎。基于不同的立场,代表个各自的利益,每个人使用数据表达自己观点的人,都会在不自觉中,收集对自己观点有正面作用的数据,而排斥对自己观点有负面作用的数据,数据清洗和筛选有时候反而成了消除异见的武器。(详见:「数据会说谎」的真实例子有哪些?

综上:

直觉与数据,双剑合璧,方能独步武林。

三、潜在的危险

作为一名数据人,经常会遇见很多有意思的事。举个栗子,以前在做推荐系统的协同过滤研究时,最常收到的用户批评类似这样:「刚买了一个电饭锅,又给我推荐一个电饭锅,谁家里要两个电饭锅?」

咋一看连续推荐两个属于同一类的物品A确实非常反人类,其实推荐系统在设计之初,已经考虑了这样的问题,所以才会加入多样性、惊喜度等多种评价指标。当然,偶尔出现重复推荐也是合情理的,万一有人真的想买两个送人呢(●—●)

记得2014年在TED上,有位研究者提出了一个很有趣的观点,大意是:由于推荐系统等技术的发展,人类在网上购物时更容易获得自己的喜欢的东西,在Facebook上更容易遇见和自己意见(政见)相同的人,更容易组成自己的小圈子。你不喜欢什么,系统就不让你看到什么。

举几个栗子,比如我不喜欢看数学书,喜欢玩电子游戏,系统就给我推荐更多的魔兽世界、炉石传说;我不喜欢希拉里,更中意川普,系统就屏蔽掉政见相异者,让我认识更多川粉;我不喜欢某个人的言论,TA关注的人和关注TA的人我都不想看见,AI说:如你所愿我的主人,我已经将所有你不喜欢的人屏蔽掉了。

咋一看,一切非常完美,生活也多了几分和谐,少了很多麻烦。但这样会出现的一个严重问题:你会活在自己的世界里。因为与你意见、爱好不同的人都被你屏蔽掉了。你会以为自己才是「多数派」,看不见更大的世界,一叶障目不见泰山;看不见更大的危险,因为众人的观点都和你相似。活在这儿,最好的结果是:成为井底之娃,活在自己的世界里很快乐。

更严重的后果是,拿小明来说,如果小明是一名抑郁症(depression)or孤独症(自闭症)患者,这样相对的封闭环境只会让小明的病情更加严重;如果小明是一名宗教极端主义者(Extremism),AI给小明推荐的都是类似的人,这样会让小明觉得自己的行为没什么异常,如果越来越多的人都这样考虑,那么形成Islamic State这样的组织也就不足为奇了。

1967年,哈佛大学的心理学教授Stanley Milgram提出的六度分隔(Six Degrees of Separation)理论——你和任何一个陌生人之间所间隔的人不会超过六个,也就是说,最多通过六个人你就能够认识任何一个陌生人。在未来的某一天,这个数字将会缩小到5、4甚至1,当间隔=1时,相当于你只要点击鼠标,你就可以于世界上任何一个人产生链接。

What A Terrible World, What A Beautiful World.

这是一个美好的世界,沟通交流如此便捷;这是一个可怕的世界,私密空间不复存在。

这是一个美好的世界,理解包容如此容易;这是一个可怕的世界,意见相左视而不见。

这是一个美好的世界,你的敌人都将屏蔽;这是一个可怕的世界,你的敌人都将隐藏。

四、敬畏之心

有二事恒然于心,敬畏日省日甚:外乎者如璀璨星穹,内在者犹道德律令。

高盛集团Quant、物理学家伊曼Emanuel Derman 在《Models.Behaving.Badly》一书中分析了在金融领域采用数学模型研究数据的危险性:在物理学研究领域,我们面对的是上帝,上帝制定了一条条规则之后,一般不会朝令夕改。但是在金融领域,我们面对的是上帝创造的人,他们估计金融资产价值的依据就是自己的直觉

同样,作为21世纪的「炼金术师」,研究上帝创造的人性时,我们也应「心怀敬畏」,脚踩数据的大地,仰望直觉的星空;忠于崇高的理想,探索复杂的现实。

曾看过这样一段话:人人生来自由,每个人都有自由选择的权力,但这也许只是一种假象。人都为了生活,每天都在做自己必须做的事情。工作、挣钱、结婚、生育,一直幻想了某一天能够财务自由,拿起背包去环游世界,但第二天仍然只能早早起床,按时上班。

如果人类未来只有一条路,希望这条路不要被人所预见。

心存敬畏之心, 方能行有所止。

以上,与所有数据人共勉。

[1].《Data-ism: The Revolution Transforming Decision Making, Consumer Behavior, and Almost Everything Else》.Steve Lohr.2015

[2].《Homo Deus:A Brief History of Tomorrow》.Yuval Noah Harari.2017

Find Me wx: Dataology


为什么要警惕《未来简史》中的数据主义?

PPV课春季读书月活动

春回大地,读者回馈

为什么要警惕《未来简史》中的数据主义?


编者按


PPV课专注大数据培训,是国内领先的大数据学习社区。在正值万物生长的暖春时节,PPV课持续为小伙伴们谋福利!

“好浮力“不放过,动动手指,好书快到我碗里来!

为什么要警惕《未来简史》中的数据主义?

活动口号:人人都是数据咖

赠送书刊:《未来简史》

活动时间:即日起至3月19日。

参与规则:在本文留言(内容自行发挥),结束后三天内抽出三位送书,中奖者后台通知领奖。


原文始发于微信公众号(PPV课数据科学社区):为什么要警惕《未来简史》中的数据主义?

原创文章,作者:ppvke,如若转载,请注明出处:http://www.ppvke.com/archives/3857

联系我们

4000-51-9191

在线咨询:点击这里给我发消息

工作时间:周一至周五,9:30-18:30,节假日休息