Category: 专栏

数据科学家新手常犯的 13 个错误(附工具、学习资源)

数据科学家新手常犯的 13 个错误(附工具、学习资源)

要成为一名数据科学家并不容易。需要掌握多种技能,才能真正成为一名数据科学家。这些技能包括解决问题、结构化思考、编程和其他专业技能。如果你不是技术出身或者数学出身,就很有可能通过书籍和视频课程来学习,但大多数并没有教你那些当前业界渴望从数据科学家身上寻找到的东西。

什么是数据科学家?

数据科学家是指能采用科学方法、运用数据挖掘工具对复杂多量的数字、符号、文字、网址、音频或视频等信息进行数字化重现与认识,并能寻找新的数据洞察的工程师或专家(不同于统计学家或分析师)。一个优秀的数据科学家需要具备的素质有:懂数据采集、懂数学算法、懂数学软件、懂数据分析、懂预测分析、懂市场应用、懂决策分析等.

解析 :跻身数据科学领域的五条职业规划道路-配图

本文中的职位是国外对数据科学和大数据相关职位的划分。本文给出和国内职位的对应关系,供大家选择职位时比对。
需要注意的是,国内外在职位叫法上略有不同。在国内“数据管理员”称为“数据库工程师”,“商业数据分析师”一般称为“数据分析师”;“数据工程师”称为“大数据开发工程师”,“机器学习研究员/工程师”称为“数据挖掘工程师”或者“算法工程师”。

AI时代就业指南:为什么要做数据分析师?职业规划很重要

我小时候的理想是将来做一名数学家,可惜长大了发现自己天赋不够,理想渐行渐远,于是开始考虑现实,开始做一些人生规划,我一直在思考将来从事何种职业,专注什么样的领域,重新定义着自己的职业理想。我现在的职业理想,比较简单,就是做一名数据分析师。

从零开始学Python【27】–Logistic回归(实战部分)

本次分享的数据是基于用户信息(年龄、性别和年收入)来判断其是否发生购买,数据来源于GitHub(文末有数据链接可供下载)。接下来,让我们看看Logistic模型是如何完成二分类问题的落地。本次分享会涉及模型的构建、测试集的预测及模型的验证三个方面。

从零开始学Python【26】–Logistic回归(理论部分)

以,我们接着线性回归,再跟大家聊聊Logistic回归。它是一个非线性的回归模型,其最大的好处恰恰是可以解决二元类问题,目前在金融行业,基本都是使用Logistic回归来预判一个用户是否为好客户,因为它还弥补了其他黑盒模型(SVM、神经网络、随机森林等)不具解释性的缺点。

从零开始学Python【16】–matplotlib(雷达图)

在这一期我们将跟大家分享一下如何借用Python绘制雷达图(或蛛网图),雷达图可以很好刻画出某些指标的横向或纵向的对比关系,例如近三年营业额、客单价、新客招募等指标的同比情况对比,完全就可以通过雷达图让数据一目了然。很不幸的是,matplotlib模块中并没有特制雷达图的封装函数,我们只能换一只思路来实现了。

从零开始学Python【15】–matplotlib(散点图)

散点图可以反映两个变量间的相关关系,即如果存在相关关系的话,它们之间是正向的线性关系还是反向的线性关系?甚至于是非线性关系?在绘制散点图之前,我们任然老规矩,先来介绍一下matplotlib包中的scatter函数用法及参数含义。

切换注册

登录

忘记密码 ?

切换登录

注册