《数据科学与大数据技术》训练营: 初级以统计分析为主,工具是R语言;中级是大数据处理+算法+python 课程以实战为主,50%的内容是案例和练习,学完就可以上手http://www.ppvke.com/Blog/archives/45839

精选导读

最新发布

Keras入门必看教程
大数据

Keras入门必看教程

2017-06-28 24℃

事实上, 我们将利用著名的 MNIST 数据集, 训练一个准确度超过 99% 的手写数字分类器. 开始之前, 请注意, 本指南是面向对应用深度学习感兴趣的初学者的. 我们旨在向你介...
R语言中不能进行深度学习?
R语言

R语言中不能进行深度学习?

2017-06-27 47℃

摘要: R语言现在能也进行深度学习了,而且和python一样好,快来试一试吧。 众所周知,R语言是统计分析最好用的语言。但在Keras和TensorFlow的帮助下,R语言...
在大数据里:Hadoop的关键性作用
Hadoop

在大数据里:Hadoop的关键性作用

2017-06-25 73℃

用于数据分析的开源Hadoop架构的巨大增长是由其结构化和非结构化数据量的增长所驱动的,并且很多权威组织也预测,未来Hadoop架构还将继续增长,并需要复杂的可访问工具来从数据中...
基于R语言构建的电影评分预测模型
R语言

基于R语言构建的电影评分预测模型

2017-06-22 130℃

 电影评分系统是一种常见的推荐系统。现在使用R语言基于协同过滤算法来构建一个电影评分预测模型。 一,前提准备         1.R语言包:ggplot2包(绘图),recomm...
我好像看到了假的数据分析?
数据分析

我好像看到了假的数据分析?

2017-06-21 76℃

作者:何明科 作为一个小头目,经常会读到来自各种团队的数据分析报告,看似基于理性和事实的雄辩,然而有可能是有意或无意的诡辩。搞得我经常像傻白甜的美少女面对追求的少男一样,面对这些严...
轻松看懂机器学习十大常用算法
机器学习

轻松看懂机器学习十大常用算法

2017-06-21 75℃

通过本篇文章大家可以对ML的常用算法形成常识性的认识。没有代码,没有复杂的理论推导,仅是图解,介绍这些算法是什么以及如何应用(例子主要是分类问题)。以后有机会再对单个算法做深入地...
自然语言处理第一番之文本分类器
自然语言(NLP)

自然语言处理第一番之文本分类器

2017-06-20 54℃

前言 文本分类应该是自然语言处理中最普遍的一个应用,例如文章自动分类、邮件自动分类、垃圾邮件识别、用户情感分类等等,在生活中有很多例子,这篇文章主要从传统和深度学习两块来解释下我...
前瞻 | 2017年大数据产业新进展及预见
大数据

前瞻 | 2017年大数据产业新进展及预见

2017-06-19 97℃

纵观国内外,大数据已经形成产业规模,并上升到国家战略层面,大数据技术和应用呈现纵深发展趋势。面向大数据的云计算技术、大数据计算框架等不断推出,新型大数据挖掘方法和算法大量出现...
我好像看到了假的数据分析?
数据分析

我好像看到了假的数据分析?

2017-06-19 81℃

​​作者:何明科 作为一个小头目,经常会读到来自各种团队的数据分析报告,看似基于理性和事实的雄辩,然而有可能是有意或无意的诡辩。搞得我经常像傻白甜的美少女面对追求的少男一样,面对这...
数据清洗要了命?这有一份手把手Python攻略
Python

数据清洗要了命?这有一份手把手Python攻略

2017-06-17 198℃

几个月前,我从网站indeed.com上抓取了招聘信息相关数据。相信很多同学都跟我做过同样的事情,想要收集不同城市的各种职位信息,然后建立一个模型来预测它们的相对薪水。 然而在建...
精确率与召回率,RoC曲线与PR曲线
机器学习

精确率与召回率,RoC曲线与PR曲线

2017-06-16 78℃

在机器学习的算法评估中,尤其是分类算法评估中,我们经常听到精确率(precision)与召回率(recall),RoC曲线与PR曲线这些概念,那这些概念到底有什么用处呢? 首先,我...
HBase 1.3 发布,性能大幅提升
大数据

HBase 1.3 发布,性能大幅提升

2017-06-15 69℃

翻译|魏星 审校|刘志勇 Apache HBase 1.3.0版在2017年1月中旬正式发布了,新版本支持分层数据的压缩和多个方面的性能提升,像预写日志(WAL)、一个新的R...
柯洁之后,32个AI里程碑全预测
人工智能

柯洁之后,32个AI里程碑全预测

2017-06-15 89℃

人类纪元2017年,世界第一柯洁哭了,为自己 0:3 对 AlphaGo 的落败。有人解读说,这预见到了人族衰败的开始,和未来两个族群之间在智力上的天渊之别。AlphaGo 在档...
2017年最流行的15个数据科学Python库
Python

2017年最流行的15个数据科学Python库

2017-06-13 159℃

Python 近几年在数据科学行业获得了人们的极大青睐,各种资源也层出不穷。数据科学解决方案公司 ActiveWizards 近日根据他们自己的应用开发经验,总结了数据科学家和工程...
大数据对于我们的生活有哪些便利
大数据

大数据对于我们的生活有哪些便利

2017-06-13 79℃

作者:勺技术 大数据 现在无处不在了,可太多数人其实并不了解 大数据 到底是什么、能做什么用。以至很多的公司都守着一堆 大数据 ,却不知如何应用。 那么让我们看看大数据到底跟我...
人工智能

一文读懂人工智能的前世今生

2017-06-12 117℃

  今年最打动你的人工智能消息是什么?是谷歌的AlphaGo程序战胜职业围棋选手?还是那个会跑、会搬运、摔倒还能站起来的无敌小强Atlas机器人?人工智能的进步可谓一日千...
sklearn:点互信息和互信息
Python

sklearn:点互信息和互信息

2017-06-09 85℃

1、点互信息PMI 机器学习相关文献里面,经常会用到点互信息PMI(Pointwise Mutual Information)这个指标来衡量两个事物之间的相关性(比如两个 词)。...