作者:Han Hsiao 来源: https://zhuanlan.zhihu.com/p/25485539知乎
FBI WARNING!本文有部分剧透!
过去人类面临的三大难题——控制饥荒、瘟疫、战争。
摆在人类面前的新三议题——获得永生、幸福、神圣。
一、圣子降临
达尔文提出《进化论》的150年后,生命科学研究认为,假设生物体都是算法,那么生命就是数据处理的过程,换言之,人是由「数据」构成的。
而研究显示,过去几年中人类制造的数据占整个人类历史数据量的95%,换言之,大数据时代已经真正降临(详见:大数据最核心的价值是什么?)。
通读全书后,作为一名数据研究者,很荣幸,Harari将最后一章留给了数据——信数据得永生。他察觉到,或者说大部分人都察觉到了,大数据正在全面改造人类的思维方式及生活方式:
因为数据流动量过大,人类无法将数据转化为信息,更不用说知识和智能。
分散式数据处理的效果比集中式数据处理更好(如市场经济和计划经济)。
民主与专制,本质上即两套不同的数据分析和信息收集的对立机制。
人类逐渐放弃直觉和经验,选择相信大数据的决策和分析 。
以上结论很容易理解。我们都知道,人类大脑的容量是有限的。而大数据,是建立在海量「历史行为」和「前人经验」上,对未来的一种洞察。人类更倾向于相信大多数人的选择,这是一种无可厚非的,符合生物本能的「自我保护机制」。比如,出行时我们通常会选择地图导航给出的最佳路线,网上购物时我们通常会选择销量最好的商品等。人类生活已经愈发离不开以大数据为基础的AI技术。
二、新世纪宗教
作者对21世纪新的宗教——「数据主义」进行了定义。数据主义者认为,宇宙是由数据组成,任何现象或实体的价值就在于对数据处理的贡献。有了更好的算法和数据,人类这种生物算法就会被自然淘汰,数据主义者信仰两条诫命:
第一诫命:要链接更多的媒体,产生更多的信息。
第二诫命:要将万物接入系统,异端也不能例外。
接着笔锋一转,开始对「数据主义」进行了暴风雨般的批判:
信仰数据主义意味着:放弃隐私、自主性和个别性。
数据主义对人类产生了威胁:不在乎我们的主观需求。
数据主义已经从中立的科学理论演变成判别是非的宗教。
数据主义者认为一切皆数据,全人类是单一的数据处理系统。
庞大的算法(如Google搜索引擎),没人能够理解其全部的要义。
机器学习和人工神经网络等「种子算法」会找出人类无法预见的东西。
批判数据主义,将成为21世纪最大的挑战及最迫切的政治和经济问题。
咋一看,某些言论有点危言耸听。反思之后发现,现实之中,确实存在两派人马:
-
技术万能派——喜欢研究各种新技术和工具,信仰「万物皆数」,技术发展决定业务导向。在他们眼中,「要么数字化,要么死亡」,一切都可以用数字来解释。
-
业务万能派——喜欢研究各种话术和营销学,信仰「情感交流」,技术仅仅是为业务服务的。在他们眼中,DA&&DM只是一种工具,属于所用的众多工具的一种。
相信作者批判的类型应该是前者,个人信仰不同,这里不谈对错,只谈利弊。
大数据,「大」字确实重要,但是远没有很多人想象的那么重要。打个不太恰当的比方,海洋里的水非常多,但是我们无法直接饮用,需要提纯和净化。数据亦是如此,高质量的数据非常宝贵,而清洗和筛选的过程决定了数据质量的好坏,但过滤后留下的不一定是「金沙」,也可能是泥沙,数据唯有结合实际业务指标,才能真正理解、判断其真正的价值。
大数据,「数」不会说谎,Numbers don’t lie,使用数据的人才会说谎。基于不同的立场,代表个各自的利益,每个人使用数据表达自己观点的人,都会在不自觉中,收集对自己观点有正面作用的数据,而排斥对自己观点有负面作用的数据,数据清洗和筛选有时候反而成了消除异见的武器。(详见:「数据会说谎」的真实例子有哪些?)
综上:
直觉与数据,双剑合璧,方能独步武林。
三、潜在的危险
作为一名数据人,经常会遇见很多有意思的事。举个栗子,以前在做推荐系统的协同过滤研究时,最常收到的用户批评类似这样:「刚买了一个电饭锅,又给我推荐一个电饭锅,谁家里要两个电饭锅?」
咋一看连续推荐两个属于同一类的物品A确实非常反人类,其实推荐系统在设计之初,已经考虑了这样的问题,所以才会加入多样性、惊喜度等多种评价指标。当然,偶尔出现重复推荐也是合情理的,万一有人真的想买两个送人呢(●—●)
记得2014年在TED上,有位研究者提出了一个很有趣的观点,大意是:由于推荐系统等技术的发展,人类在网上购物时更容易获得自己的喜欢的东西,在Facebook上更容易遇见和自己意见(政见)相同的人,更容易组成自己的小圈子。你不喜欢什么,系统就不让你看到什么。
举几个栗子,比如我不喜欢看数学书,喜欢玩电子游戏,系统就给我推荐更多的魔兽世界、炉石传说;我不喜欢希拉里,更中意川普,系统就屏蔽掉政见相异者,让我认识更多川粉;我不喜欢某个人的言论,TA关注的人和关注TA的人我都不想看见,AI说:如你所愿我的主人,我已经将所有你不喜欢的人屏蔽掉了。
咋一看,一切非常完美,生活也多了几分和谐,少了很多麻烦。但这样会出现的一个严重问题:你会活在自己的世界里。因为与你意见、爱好不同的人都被你屏蔽掉了。你会以为自己才是「多数派」,看不见更大的世界,一叶障目不见泰山;看不见更大的危险,因为众人的观点都和你相似。活在这儿,最好的结果是:成为井底之娃,活在自己的世界里很快乐。
更严重的后果是,拿小明来说,如果小明是一名抑郁症(depression)or孤独症(自闭症)患者,这样相对的封闭环境只会让小明的病情更加严重;如果小明是一名宗教极端主义者(Extremism),AI给小明推荐的都是类似的人,这样会让小明觉得自己的行为没什么异常,如果越来越多的人都这样考虑,那么形成Islamic State这样的组织也就不足为奇了。
1967年,哈佛大学的心理学教授Stanley Milgram提出的六度分隔(Six Degrees of Separation)理论——你和任何一个陌生人之间所间隔的人不会超过六个,也就是说,最多通过六个人你就能够认识任何一个陌生人。在未来的某一天,这个数字将会缩小到5、4甚至1,当间隔=1时,相当于你只要点击鼠标,你就可以于世界上任何一个人产生链接。
What A Terrible World, What A Beautiful World.
这是一个美好的世界,沟通交流如此便捷;这是一个可怕的世界,私密空间不复存在。
这是一个美好的世界,理解包容如此容易;这是一个可怕的世界,意见相左视而不见。
这是一个美好的世界,你的敌人都将屏蔽;这是一个可怕的世界,你的敌人都将隐藏。
四、敬畏之心
有二事恒然于心,敬畏日省日甚:外乎者如璀璨星穹,内在者犹道德律令。
高盛集团Quant、物理学家伊曼Emanuel Derman 在《Models.Behaving.Badly》一书中分析了在金融领域采用数学模型研究数据的危险性:在物理学研究领域,我们面对的是上帝,上帝制定了一条条规则之后,一般不会朝令夕改。但是在金融领域,我们面对的是上帝创造的人,他们估计金融资产价值的依据就是自己的直觉。
同样,作为21世纪的「炼金术师」,研究上帝创造的人性时,我们也应「心怀敬畏」,脚踩数据的大地,仰望直觉的星空;忠于崇高的理想,探索复杂的现实。
曾看过这样一段话:人人生来自由,每个人都有自由选择的权力,但这也许只是一种假象。人都为了生活,每天都在做自己必须做的事情。工作、挣钱、结婚、生育,一直幻想了某一天能够财务自由,拿起背包去环游世界,但第二天仍然只能早早起床,按时上班。
如果人类未来只有一条路,希望这条路不要被人所预见。
心存敬畏之心, 方能行有所止。
以上,与所有数据人共勉。
[1].《Data-ism: The Revolution Transforming Decision Making, Consumer Behavior, and Almost Everything Else》.Steve Lohr.2015
[2].《Homo Deus:A Brief History of Tomorrow》.Yuval Noah Harari.2017
Find Me wx: Dataology
编者按
PPV课专注大数据培训,是国内领先的大数据学习社区。在正值万物生长的暖春时节,PPV课持续为小伙伴们谋福利!
“好浮力“不放过,动动手指,好书快到我碗里来!
活动口号:人人都是数据咖
赠送书刊:《未来简史》
活动时间:即日起至3月19日。
参与规则:在本文留言(内容自行发挥),结束后三天内抽出三位送书,中奖者后台通知领奖。
原文始发于微信公众号(PPV课数据科学社区):为什么要警惕《未来简史》中的数据主义?
原创文章,作者:ppvke,如若转载,请注明出处:http://www.ppvke.com/archives/3857