《大数据-机器学习脱产培训班》第2期,4个月成就高薪梦想,培养数据挖掘工程师,签订就业服务协议,对接50多家大数据企业 !理论+工具+实习,培养实战型数据挖掘人才! 3月27号开课(深圳),仅20席名额,报名速度!http://www.ppvke.com/Answer/page/dashujujiqixuexi

精选导读

最新发布

数据分析师的必读书单
数据分析

数据分析师的必读书单

2017-02-22 90℃ 0评论

文 | 秦路 有不少人留言希望我推荐数据分析的书单,刚好即将春节,无论是假日学习还是年后,都值得充电。读书最好的时候是学生时期,其次是现在。内容按照 《如何七周成为数据分析师 》...
史上最全的“大数据”学习资源(下)
大数据

史上最全的“大数据”学习资源(下)

2017-02-22 51℃ 0评论

摘要: 当今“大数据”一词的重点其实已经不仅在于数据规模的定义,它更代表着信息技术发展进入了一个新的时代,代表着爆炸性的数据信息给传统的计算技术和信息技术带来的技术挑战和困难,代...
史上最全的“大数据”学习资源(上)
大数据

史上最全的“大数据”学习资源(上)

2017-02-21 99℃ 0评论

摘要: 当今“大数据”一词的重点其实已经不仅在于数据规模的定义,它更代表着信息技术发展进入了一个新的时代,代表着爆炸性的数据信息给传统的计算技术和信息技术带来的技术挑战和困难,代表...
手把手教你做文本挖掘
大数据

手把手教你做文本挖掘

2017-02-21 50℃ 0评论

一、文本挖掘定义 文本挖掘指的是从文本数据中获取有价值的信息和知识,它是数据挖掘中的一种方法。文本挖掘中最重要最基本的应用是实现文本的分类和聚类,前者是有监督的挖掘算法,后者是无...
Spark的性能调优
Spark

Spark的性能调优

2017-02-20 50℃ 0评论

基本概念和原则 首先,要搞清楚Spark的几个基本概念和原则,否则系统的性能调优无从谈起: 每一台host上面可以并行N个worker,每一个worker下面可以并行M个ex...
写给新人的数据库指南
数据库

写给新人的数据库指南

2017-02-18 40℃ 0评论

我们进入第四周数据库的内容,在数据分析师的职业生涯中,数据库与SQL会是他们性价比最高的技能之一。 数据库是逻辑上的概念,它是一堆互相关联的数据,放在物理实体上,是一堆写在磁盘上...
朴素贝叶斯新闻分类器详解
算法

朴素贝叶斯新闻分类器详解

2017-02-17 47℃ 0评论

2012-11-11 机器学习的三要素是模型、策略(使用Cost Function计算这个模型是不是好的)和优化算法(不断的寻找最优参数,找到一个参数后用策略判断一下是不是可以,...
用Python获取银行网站上的存贷款利率表
Python

用Python获取银行网站上的存贷款利率表

2017-02-16 53℃ 0评论

项目背景 最近在做一个利率市场化咨询的项目,主要是协助银行搭建定价体系,提供定价策略,在充分考虑产品差异、顾客需求差异、时间差异、地点差异等因素基础上制定不同的存贷款定价方法。 在...
2016年数据科学薪酬大盘点
舆情传播

2016年数据科学薪酬大盘点

2017-02-13 602℃ 0评论

文 | Evelyn Shen 这是O’Reilly关于数据科学职位薪酬的第四次研究。本次研究的983个样本来自45个国家以及美国45个州的不同行业。通过本次调查的64个问题,我...
这一年来,数据科学家都用哪些算法?
大数据

这一年来,数据科学家都用哪些算法?

2017-02-10 88℃ 0评论

在“数据为王”的今天,越来越多的人对数据科学产生了兴趣。数据科学家离不开算法的使用,那么,数据科学家最常用的算法,都是哪些呢? 最近,著名的资料探勘信息网站 KDnuggets ...
从零开始的Python爬虫速成指南
Python

从零开始的Python爬虫速成指南

2017-02-09 132℃ 0评论

序 本文主要内容:以最短的时间写一个最简单的爬虫,可以抓取论坛的帖子标题和帖子内容。 本文受众:没写过爬虫的萌新。 入门 0.准备工作 需要准备的东西: Python、scrap...