1. 首页
  2. 数据挖掘

用数据对抗雾霾:《穹顶之下》的启示

用数据对抗雾霾

━━━━━━━━━━━━━━━━

《穹顶之下》的启示

用数据对抗雾霾:《穹顶之下》的启示

作者:中国人民大学 冯启娜

阅读引语
柴静的演讲恐怕是迄今为止中国的公开演讲中引用数据最多的一场。数据是对抗雾霾的强大武器,是环境治理的基础。也许正因如此,“大数据”这个时髦词汇,在李克强总理的字典里也占有重要的一席之地。

228日,《穹顶之下》发布后10个小时,在主流视频网站创造了超过3000万点播量、40000条评论的纪录。有人把传播上的成功归结于各种互联网营销策略,而我则认为赋予这场演讲力量的核心要素是——数据。

柴静的这场演讲,全程用数据说话,恐怕是迄今为止中国的公开演讲中引用数据最多的一场。据笔者统计,纪录片中,演讲共提及了203个数据,视频共提及了129个数据(不含日期和量词),播放了共51张数据表,平均下来,每分钟呈现3条数据、0.5张数据表。正是这些数据,以理性、精确、客观的方式,为我们拨开雾霾背后的层层真相,道出直抵人心的震撼事实。

然而,这场演讲给我们的启示,绝不仅仅是把数据作为一种演讲的工具,把数据作为论证雾霾问题的一种修辞手法;更重要的是,它告诉我们,数据是对抗雾霾的强大武器,是环境治理诸多路径的基础与核心。这才是这场演讲的时代意义之所在。

数据监测
雾霾治理的起点

相信每个看完《穹顶之下》的人,都会对柴静提出的这三个问题印象深刻:雾霾是什么?从哪来?怎么办?这三个问题的答案,都在各种各样的监测数据之中。从颗粒物构成的检验,到各个国家地区、各个时期空气污染情况的比较,从能源开采结构,到能源使用结构的分析……数据一出,答案自明。

这些数据,源自柴静此前十余年采访素材的积累,而她在辞职一年后才推出这部作品,我想,这其中最艰难、最耗时、最需要博弈的部分应该就是数据收集吧。数据有的来自部委,有的来自专家,有的来自企业,有的来自上了年头的调研报告,甚至还有一组数据来自NASA。把这些数据一一汇总,一一求证,并系统地介绍到公众面前,是我认为《穹顶之下》最大的贡献。

然而,雾霾监测并非易事。首先是建立监测站的成本相对昂贵。北京市2012年建立了首批20个空气质量监测站,目前监测站的数量增长到了35个,但还非常有限。因为一个城市的空气质量非常不均匀,有时候在同一时间非常近的两个地点,空气质量读数可以差得很远。这是由于一个地方的空气质量有很多复杂因素来决定,涉及大气物理、化学、生物、陆地及大气耦合等,这些因素任意几个互相结合,或同时发生,都会对雾霾的成分,规模及危害性产生巨大的影响。

也就是说,如果我们能考虑到尽可能多的因素,检测到尽可能多的数据,就能大大提高雾霾预测的准确性。微软亚洲研究院的郑宇博士主持了一项对雾霾异构数据的研究。他把气象条件数据,比如刮风、下雨、湿度、气压,以及交通流量数据,还有单位时间的人流数据,和餐馆、公园、广场的分布数据等等,结合起来,建立了一个空气质量的模型,可以算出北京任何一个角落一公里乘一公里细粒度的空气质量。有了这种细粒度的数据,我们才能更好地知道什么时候去跑步、什么时候让小孩出来,知道什么原因导致的污染、哪个地方总是被污染,并用这些数据来指导治理。

因此,要治理雾霾,仅靠环保部门的数据,仅靠好的算法,还远远不够。要把一个地方的规划、交通、工商等部门也联合起来,共同把自己的数据纳入一个空气质量模型,才能把雾霾的问题说得比较清楚。

用数据对抗雾霾:《穹顶之下》的启示

数据竞争
推动行业标准的进步

《穹顶之下》向我们揭示了雾现象背后的一个罪恶根源——能源行业标准被能源公司直接操控。比如,在石油行业标准委员会这样的组织中,企业又当裁判员,又当运动员,所谓的行业标准被利益绑架,从而严重背离公共环境福祉。

那么,行业标准究竟该如何制定?柴静主张要由环保部门主导,美国、欧盟、澳大利亚、日本等国家和地区皆如此。然而,这只是第一步,在政策制定的实际过程中,即便是美国这样环保部门强势、环保制度健全的国家,依然要经历一番激烈的利益之争。

在《大数据》作者、阿里巴巴副总裁涂子沛的新著《数据之巅》中,就记载了这样一个真实的案例。

1996 年,美国环保局按照《清洁空气法》,提出要将空气质量的的臭氧标准设定为 0.08ppm(百万分之一),将 PM10 的标准定为每立方米空气中少于 65 微克,而且全年的平均值不得超过 15 微克。

为了确定这两个标准的具体大小,国家环保局做了几百页的成本收益分析报告。比如,提高标准的收益主要包括三方面的数据:一是呼吸系统疾病的发病率将大幅下降,这将挽救部分人的生命、节省医疗开支;二是空气质量提高后,地表的各种谷物、水果、植被将增产增收;三是改善城市的能见度,减少交通事故,提高生产效率。最后得出的分析结果是,由于这两项空气指标的提高,全社会的收益至少为 194 亿美元,最高可达到 1 061 亿美元,而同时,全国的企业需要支出 97 亿美元来改善生产设施、控制排放,这 97 亿美元也就是这个项目的成本。

环保局的主张,遭到了交通运输、炼钢炼油、发电煤矿、化工造纸、建筑材料等美国工业界诸多行业的围攻,连西弗吉尼亚州、密歇根州的州政府也表示强烈反对,因为他们拥有大量的汽车工厂和矿区,要提高空气质量,就要承担更高的成本。于是,美国货车运输协会联合了很多个公司、商会以及西弗吉尼亚等几个州的州政府,把美国环保局告上了法庭,最后一直闹到了最高法院。法院重审的结果还是维护了环保局的权威,新的空气标准也得以实行。

像这样的环保公案,在美国历史上数不胜数。它们都有一些共同特征:利益冲突由数据引起(行业标准),利益博弈基于数据竞争,而在争取舆论和法庭支持的时候,基于成本收益方法的数据分析是最有力的武器。

诚如涂子沛所言,政府制定、发布的每一项数据,“都关系到资源的调配、利益的消长,各种公司、社会团体、人群都在其中游说、博弈,试图影响政府的决策天平,使其尽可能地偏向自己,但成本收益分析方法要求公开罗列出所有的成本和收益,把它摊开在天地之间,并从全社会的角度出发,谋求净收益的最大化,这促进了公共福利的发展,减少了公共政策被利益集团操控的可能性。”

《穹顶之下》中探讨的能源行业标准的升级,不正应当如此吗?

用数据对抗雾霾:《穹顶之下》的启示

数据开放
让公民参与雾霾治理

柴静有一句话让我印象特别深刻:“世界上再强大的政府也无法独立治理好污染。”——雾霾治理仅靠政府是不够的,仅靠环保部门更不行,它一定需要公民个体和民间组织的参与。

“治理”是十八大以后的一个高频词,它与“管理”仅一字之变,却代表了行政模式从单一主体、单向垂直运作向多主体参与、双向扁平互动的转型。怎么参与?怎么转型?柴静说:“2003年非典,我得到最好的启示是,只有信息公开才是一切群众参与的基础。”

《数据之巅》这本书里还讲了这样一段历史。

1986 年,美国国会通过立法,要求相关企业必须每年公开其排放到空气、水源或土壤中的有毒化学物品的数量。

工业界极力反对。在立法过程中,它们进行了大量游说,并且成功地缩小了公开的范围和下降的程度。例如,为了使公开的数据不至于令人立即联想到严重的化学污染,工业界要求减少需要公开的化学品项目和种类,并成功地将公开的范围缩小到最终排放的化学物品,而不包括其使用的有毒化学物品的多少。此外,工业界还要求企业能够自主测定其排放量,尽量让“数据”好看一些。

因为这些妥协,当时没有人看好这部法律,甚至连负责执行的美国国家环保局也认为这只是走走过场,不会产生很大的作用,相反,核实、汇总、发布这些数据将极大地增加其工作负担。

但出人意料的是,这部法律获得了极大的成功,并且成为美国信息公开的转折点。在该法律颁布的第一年,一些大公司的头头脑脑就先后主动站出来表态,声称企业负有保护环境的社会责任,应该控制、减少这些有毒物质的排放。有的企业领导甚至向新闻界公开承诺,要将现有的排放量减少 90%。此后,全国的排放量每年都在下降,同时经济发展并没有停滞,到了 1998 年,全国各种有毒化学物质的排放量较 1986 年减少了一半。美国国家环保局事后总结,这是近 30 年来最成功的环境政策。

以前,我们对数据开放的认识还停留在知情权层面。但是实际上,数据还是一种制衡的力量。《数据之巅》指出:“通过公开数据,把企业置于全社会的舆论和监督之下,使其自觉、自愿降低污染物质的排放量,矛盾得到转移,问题得到解决。通过这项法律,美国政府真真切切地领会到数据公开的制衡作用,意识到开放本身就是一种有效的管理手段。此后,环境数据的披露,成为美国环境政策的主流措施,数据公开,成为美国政府一种全新的调控手段。对政府而言,原来被动的公开开始变为主动。”“美国政府对公开的手段运用得越来越娴熟,把内开放的社会管理功能、市场调控功能发挥得淋漓尽致,除了环境污染,在产品质量、食品卫生、药物安全等棘手的社会领域,都主动且大量地采用公开的方法。”

在我国,环保部门已经建立了世界上最为庞大的对污染企业的在线监测系统。民间的尝试也已经开启,其中有代表性的是由著名环保人士马军领衔的环保NGO组织——公众与环境研究中心。他们已于2006年开始先后制定了“中国水污染地图”和“中国空气污染地图”,建立了国内首个公益性的水污染和空气污染数据库。相信通过这些努力,每个人将置于可被认识的环境风险之下,赢取环境治理上的最大动力和参与。

用数据对抗雾霾:《穹顶之下》的启示

数据智能
节能减排的利器

在对抗雾霾的这场战役中,数据还大有可为。比如,汽车尾气是雾霾的一大成因,在道路拥堵时尤甚。而通过车载GPS数据、公交刷卡数据、道路摄像头数据,我们可以感知整座城市的交通流量和人们的移动规律,从而改进城市规划、改善公共交通、科学调控私家车数据,降低汽车拥堵带来能源消耗,并减少有害气体排放。

再比如,中国有很多用烧煤来发电的火电厂,污染严重。传统电网在发电和输电的过程中,又有很多浪费。而智能电网则可以实时获取各个地区的用电数据,对发电量进行动态调控,提高电力资源的利用率,这也是治理雾霾的方法之一。

更重要的是,诸多高污染、高能耗、低产值的传统产业包括农业、制造业的转型,还有电商、教育、健康医疗、互联网金融等新兴服务业的发展,都需要用数据来驱动,用数据来倒逼,从而推动国家整体经济结构的调整。

也许正因如此,“大数据”这个令不少互联网企业家激动的时髦词汇,在李克强总理的字典里也占有重要的一席之地。据新华网统计,进入2015年的短短两个月内,“大数据”4次出现在总理活动的公开报道中。而“大数据”首度进入政府工作报告,正是一年前的两会。李克强总理还在那次政府报告中强调,要像“向贫困宣战”一样“向污染宣战”。

“向污染宣战”,首先需要的就是“知己知彼”的环境信息获取与公开,“大数据”正是其实现的重要手段之一。加快环境监管的“大数据”步伐,当被早日提上议事日程并付诸实施。

PPV课其他精彩文章:


1、回复“干货”查看干货 数据分析师完整知识结构

2、回复“答案”查看大数据Hadoop面试笔试题及答案

3、回复“设计”查看这是我见过最逆天的设计,令人惊叹叫绝

4、回复“可视化”查看数据可视化专题-数据可视化案例与工具

5、回复“禅师”查看当禅师遇到一位理科生,后来禅师疯了!!知识无极限

6、回复“啤酒”查看数据挖掘关联注明案例-啤酒喝尿布

7、回复“栋察”查看大数据栋察——大数据时代的历史机遇连载

8、回复“数据咖”查看数据咖——PPV课数据爱好者俱乐部省分会会长招募

9、回复每日一课查看【每日一课】手机在线视频集锦

PPV课大数据ID: ppvke123 (长按可复制)

大数据人才的摇篮!专注大数据行业人才的培养。每日一课,大数据(EXCEL、SAS、SPSS、Hadoop、CDA)视频课程。大数据资讯,每日分享!数据咖—PPV课数据爱好者俱乐部!

原文始发于微信公众号(PPV课数据科学社区):用数据对抗雾霾:《穹顶之下》的启示

原创文章,作者:ppvke,如若转载,请注明出处:http://www.ppvke.com/archives/25122

联系我们

4000-51-9191

在线咨询:点击这里给我发消息

工作时间:周一至周五,9:30-18:30,节假日休息