《数据科学与大数据技术》训练营: 初级以统计分析为主,工具是R语言;中级是大数据处理+算法+python 课程以实战为主,50%的内容是案例和练习,学完就可以上手http://www.ppvke.com/Blog/archives/45839

最新发布 第2页

在大数据里:Hadoop的关键性作用
Hadoop

在大数据里:Hadoop的关键性作用

2017-06-25 165℃

用于数据分析的开源Hadoop架构的巨大增长是由其结构化和非结构化数据量的增长所驱动的,并且很多权威组织也预测,未来Hadoop架构还将继续增长,并需要复杂的可访问工具来从数据中...
基于R语言构建的电影评分预测模型
R语言

基于R语言构建的电影评分预测模型

2017-06-22 294℃

 电影评分系统是一种常见的推荐系统。现在使用R语言基于协同过滤算法来构建一个电影评分预测模型。 一,前提准备         1.R语言包:ggplot2包(绘图),recomm...
我好像看到了假的数据分析?
数据分析

我好像看到了假的数据分析?

2017-06-21 219℃

作者:何明科 作为一个小头目,经常会读到来自各种团队的数据分析报告,看似基于理性和事实的雄辩,然而有可能是有意或无意的诡辩。搞得我经常像傻白甜的美少女面对追求的少男一样,面对这些严...
轻松看懂机器学习十大常用算法
机器学习

轻松看懂机器学习十大常用算法

2017-06-21 234℃

通过本篇文章大家可以对ML的常用算法形成常识性的认识。没有代码,没有复杂的理论推导,仅是图解,介绍这些算法是什么以及如何应用(例子主要是分类问题)。以后有机会再对单个算法做深入地...
自然语言处理第一番之文本分类器
自然语言(NLP)

自然语言处理第一番之文本分类器

2017-06-20 119℃

前言 文本分类应该是自然语言处理中最普遍的一个应用,例如文章自动分类、邮件自动分类、垃圾邮件识别、用户情感分类等等,在生活中有很多例子,这篇文章主要从传统和深度学习两块来解释下我...
前瞻 | 2017年大数据产业新进展及预见
大数据

前瞻 | 2017年大数据产业新进展及预见

2017-06-19 178℃

纵观国内外,大数据已经形成产业规模,并上升到国家战略层面,大数据技术和应用呈现纵深发展趋势。面向大数据的云计算技术、大数据计算框架等不断推出,新型大数据挖掘方法和算法大量出现...
我好像看到了假的数据分析?
数据分析

我好像看到了假的数据分析?

2017-06-19 163℃

​​作者:何明科 作为一个小头目,经常会读到来自各种团队的数据分析报告,看似基于理性和事实的雄辩,然而有可能是有意或无意的诡辩。搞得我经常像傻白甜的美少女面对追求的少男一样,面对这...
数据清洗要了命?这有一份手把手Python攻略
Python

数据清洗要了命?这有一份手把手Python攻略

2017-06-17 325℃

几个月前,我从网站indeed.com上抓取了招聘信息相关数据。相信很多同学都跟我做过同样的事情,想要收集不同城市的各种职位信息,然后建立一个模型来预测它们的相对薪水。 然而在建...
精确率与召回率,RoC曲线与PR曲线
机器学习

精确率与召回率,RoC曲线与PR曲线

2017-06-16 149℃

在机器学习的算法评估中,尤其是分类算法评估中,我们经常听到精确率(precision)与召回率(recall),RoC曲线与PR曲线这些概念,那这些概念到底有什么用处呢? 首先,我...
HBase 1.3 发布,性能大幅提升
大数据

HBase 1.3 发布,性能大幅提升

2017-06-15 106℃

翻译|魏星 审校|刘志勇 Apache HBase 1.3.0版在2017年1月中旬正式发布了,新版本支持分层数据的压缩和多个方面的性能提升,像预写日志(WAL)、一个新的R...
柯洁之后,32个AI里程碑全预测
人工智能

柯洁之后,32个AI里程碑全预测

2017-06-15 134℃

人类纪元2017年,世界第一柯洁哭了,为自己 0:3 对 AlphaGo 的落败。有人解读说,这预见到了人族衰败的开始,和未来两个族群之间在智力上的天渊之别。AlphaGo 在档...
2017年最流行的15个数据科学Python库
Python

2017年最流行的15个数据科学Python库

2017-06-13 300℃

Python 近几年在数据科学行业获得了人们的极大青睐,各种资源也层出不穷。数据科学解决方案公司 ActiveWizards 近日根据他们自己的应用开发经验,总结了数据科学家和工程...
大数据对于我们的生活有哪些便利
大数据

大数据对于我们的生活有哪些便利

2017-06-13 181℃

作者:勺技术 大数据 现在无处不在了,可太多数人其实并不了解 大数据 到底是什么、能做什么用。以至很多的公司都守着一堆 大数据 ,却不知如何应用。 那么让我们看看大数据到底跟我...
人工智能

一文读懂人工智能的前世今生

2017-06-12 178℃

  今年最打动你的人工智能消息是什么?是谷歌的AlphaGo程序战胜职业围棋选手?还是那个会跑、会搬运、摔倒还能站起来的无敌小强Atlas机器人?人工智能的进步可谓一日千...
sklearn:点互信息和互信息
Python

sklearn:点互信息和互信息

2017-06-09 187℃

1、点互信息PMI 机器学习相关文献里面,经常会用到点互信息PMI(Pointwise Mutual Information)这个指标来衡量两个事物之间的相关性(比如两个 词)。...
机器学习10大经典算法
机器学习

机器学习10大经典算法

2017-06-07 255℃

1、C4.5 机器学习中,决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应...
推荐:六款强大的开源数据挖掘工具
数据挖掘

推荐:六款强大的开源数据挖掘工具

2017-06-07 214℃

在互联网发展到大数据时代,那么数据就等于金钱。随着向一个基于应用的领域过渡,数据则呈现出了指数级增长。 在互联网发展到大数据时代,那么数据就等于金钱。随着向一个基于应用的领域过...
13个真实世界情景中的数据科学应用
大数据

13个真实世界情景中的数据科学应用

2017-06-05 173℃

现在让我们看看13个在真实世界情景下的例子,了解现代数据科学家可以帮助我们做些什么。这些例子将有助于你学习如何专注于一个问题和如何形式化一个问题,以及如何仔细评估所有潜在问题——...
Hadoop学习资源集合
Hadoop

Hadoop学习资源集合

2017-06-05 227℃

摘要: Hadoop是一个由Apache基金会所开发的开源分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力进行高速运算和存储。为了云栖...