按时间归档:2016年06月
-
【新闻】大数据可视化的新动态
大数据可视化的新动态 Intetix Foundation(英明泰思基金会)由从事数据科学、非营利组织和公共政策研究的中国学者发起成立,致力于通过数据科学改善人类社会和自然环境。通…
-
【平台】详细总结 Hive VS 传统关系型数据库
本文思路,看图说话,一张图,清晰总结二者区别 下面对图中的各条做详细总结 1 查询语言 不做赘述 2 数据存储位置 不做赘述 3 数据格式 Hive:Hive 中没有定义专门的数据…
-
【机器学习】机器学习系列:(一)机器学习基础
本章我们简要介绍下机器学习(Machine Learning)的基本概念。主要介绍机器学习算法的应用,监督学习和无监督学习(supervised-unsupervised lear…
-
【V课堂】数据挖掘知识脉络与资源整理(六)–matlab
简介 MATLAB 是美国MathWorks公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境,主要包括MATLAB和Simuli…
-
【职场】“数据咖”的自我修炼
不管你是刚进入大学读CS,梦想着毕业后进入机器学习领域;抑或是刚踏入社会,从事着数据分析工作的小职员,你是否曾45度角仰望星空,梦想着有朝一日在数据这条路上走上人生巅峰?不管你的梦…
-
【V课堂】R语言十八讲(十六)—广义线性模型
所谓广义线性模型,顾名思义就是一般狭义线性模型的推广,那我们先看看我们一般的狭义线性模型,这在第十讲也说过可以参看http://www.ppvke.com/Blog/archive…
-
【观点】统计学的七大支柱
JSM上统计界的老帮主Stephen Stigler做了一个主题演讲,讲“统计学的七大支柱”,好心又认真的Rick Wicklin同学记了笔记,彼时估计还在中国城吃饭的我才得以了解…
-
【培训】CDA数据分析师系统培训 LEVEL Ⅰ(18期) 北京/上海/深圳/远程 7月火热开启!
CDA课程体系包含了数据分析师要掌握的必备技术(理论,模型,算法,数据库,编程,工具,业务等),数据分析不是一朝一夕,而是长期的一个学习过程,我们能提供给你的是有效的方法,实用的技…
-
【V课堂】数据挖掘知识脉络与资源整理(五)–缺失值处理
简介: 缺失值是指粗糙数据中由于缺少信息而造成的数据的聚类,分组,删失或截断。它指的是现有数据集中某个或某些属性的值是不完全的。数据挖掘所面对的数据不是特地为某个挖掘目的收集的,所…
-
【应用】揭秘互联网金融的大数据风控
大数据能够进行数据变现的商业模式目前就是两个,一个是精准营销,典型的场景是商品推荐和精准广告投放,另外一个是大数据风控,典型的场景是互联网金融的大数据风控。 金融的本质是风险管理,…