按时间归档:2016年08月
-
如何用R语言对城管事件数据分析?
这次使用主成分分析主要目的并不是降维,而是分析城管数据中的事件类别之间是否存在关系,当然,城管事件类型有好几百,这里就只选取从去年九月到目前发生量前十的事件类别;如下图,排名前十的…
-
有什么理由让我们选择SAS
2016CDAS中国数据分析师行业峰会将于9月3日-CDA9月4日在北京国际会议中心举办,敬请期待! 数据挖掘:从现有的大量数据中,攫取不明显、之前未知、可能有用的知识 ——Wil…
-
数据新闻精选| R语言和网络图:数据叙事好帮手
R语言能挖掘、整理数据,网络图可以呈现故事脉络,两者各显神通。深度君精选数据网站FiveThirtyEight的R语言应用心得,数据新闻网络图叙事的类型,还可参考《处理数据、制作可…
-
大熊学python3爬虫–scrapy浅探(一)
在介绍scrapy之前,我觉得简单介绍下python的class很有必要。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 classcaini…
-
七夕情人节,看 —大数据时代里的爱情!
从前,在西雅图的一家Pony Expresso咖啡店里,一个男人与一个女人开始了对这个绵长而又神秘的事物的体验,这个事物已得到了愈来愈多科学研究,而我们称其为爱情。最初的阶段被称为…
-
Ambari——大数据平台的搭建利器
Ambari 是什么 Ambari 跟 Hadoop 等开源软件一样,也是 Apache Software Foundation 中的一个项目,并且是顶级项目。目前最新的发布版本是…
-
8月13号正式开课,还在犹豫的赶紧报名啦!全面学习Hadoop/Spark生态系统及数据分析技术,颁发工信部专项技术证书!
一、什么是Hadoop? Hadoop是一个能够对大量数据进行分布式处理的软件框架,实现了Google的MapReduce编程模型和框架,能够把应用程序分割成许多小的工作单元,并把…
-
如何向你的“弱智室友”解释区块链?
行业报道 导读:事情是这样的,最近我的室友Hasaki一直在问我区块链和比特币的事情,我尝试了很多种不通的姿势以求简单通俗形象生动地跟他解释什么是区块链技术,但是最后都失败了。因此…
-
递归神经网络(RNN)在语义识别方面的应用
背景 数据时代已经到来,当今企业家们已经认识到数据的重要性,并且期望通过数据分析能够驱动增长。企业业务流程面临“计划驱动”转型到”数据驱动“的巨大变革。企业需要关注的不是大数据问题…
-
四两拨千斤:借助Spark GraphX将QQ千亿关系链计算提速20倍
腾讯QQ有着国内最大的关系链,而共同好友数,属于社交网络分析的基本指标之一,是其它复杂指标的基础。借助Spark GraphX,我们用寥寥100行核心代码,在高配置的TDW-Spa…