1. 首页
  2. 数据挖掘

对于打算入门数据分析的菜鸟来说,你想提醒他们什么?

在知乎上看到这样一个问题:

“面对大数据时代趋势和与之相对的高薪,越来越多没有怎么学过计算机和统计学的外门人士也想跃跃欲试踏进数据科学的领域,请问大家伙儿有没有点建议想提醒新人呢。比如一路走来最困难的瓶颈期是在什么阶段?为了这一专业都牺牲了什么?与此同时又给你们带来了什么?在枯燥的学习过程中,学习的原动力和兴趣来源是靠什么?”

针对以上问题,在这里做一个回答,希望能对打算入门数据分析的朋友有帮助,以下为正文:

首先,你必须清楚在数据科学领域有两个截然不同的职业方向:数据分析师和数据工程师。他们的工作方式是截然不同的。

数据分析师偏业务,专注于研究数据和结果之间的关系,数据和结果之间的关系通常是不确定的,没有严谨的数学逻辑,他们在很大程度上只满足某种统计分布规律。

对于打算入门数据分析的菜鸟来说,你想提醒他们什么?

而数据工程师,专注大数据软件系统的搭建、数据库和数据管道的构建,目的是让数据可以存储和可以流动起来。所有的软件工程都是规范而严谨的,与不确定性几乎没有关系。

对于打算入门数据分析的菜鸟来说,你想提醒他们什么?

简单说工程师的思维逻辑是“若A,则B”,而数据科学家的思维逻辑是“若A,则可能B”。如果你对事物缺乏敏感;喜欢严谨的数学逻辑,不喜欢我猜我猜我猜猜猜,那么前者的工作可能更适合你。

其次,在学习数据分析之前应该明白几点:

  • 数据初期的准备通常占整个数据挖掘项目工作量的70%左右。

  • 数据分析师本身融合了业务知识、统计学和计算机等学科,并不是新的技术。

  • 数据分析更适合业务人员学习(相比技术人员学习业务来的更高效)

  • 数据分析项目通常需要重复一些毫无技术含量的工作。

数据分析师的最主要能力是数据思维或者说数据意识,也就是说你必须具有数据和结果之间关系的直觉意识、探索能力和分析能力。为此你必须把更多时间花在数据生成过程的思维模式训练上,并研究如何把这些思维模式转换成统计学的术语,并最终通过软件工程的代码实现它。

数据分析师的坑

所谓成也不确定性,败也不确定性,数据分析师的坑在于你永远可能接近不了真相和标准答案,你只能寻找一个更接近于真相的最优结果,为此你必须保持清晰的头脑,1%的匹配误差在推荐系统中几乎可以忽略不计,但同样1%的误差在金融风控等领域就是完全无法接受的,为此你必须谨慎和保持清醒的认识。你必须在一开始就找到评估你模型的方法,并不断的通过数据去校正你的分析模型。这个分析过程有时是枯燥的,特别是当你重复某些毫无技术含量的工作。

数据分析的工作就像制造一辆“安全”的无人驾驶汽车,你必须理解“安全”的范围,如果安全的范围是可以描述和界定的,你必须考虑各种路况和未知的因素去满足这一“安全”的标准,这个过程存在太多的未知因素和变量。如果这个“安全”范围本身就是一个变量,那么情况将变得更为复杂。

数据分析师的bonus

对数据分析师而言,最好的bonus是他多了一个观察世界的眼睛,在很多人在三维世界里挣扎的时候,他有可能具有N维空间的观察能力,所谓“不识庐山真面目,只缘身在此山中”,跳出来看问题可能会让你拥有常人无法拥有的某种“预测”的能力,这种能力有可能会让你身价倍增。

以上为全部内容,若对您有帮助,请分享给更多的人,谢谢!

END.

PPV课原创

相关推荐:

原文始发于微信公众号(PPV课数据科学社区):对于打算入门数据分析的菜鸟来说,你想提醒他们什么?

原创文章,作者:ppvke,如若转载,请注明出处:http://www.ppvke.com/archives/6201

联系我们

4000-51-9191

在线咨询:点击这里给我发消息

工作时间:周一至周五,9:30-18:30,节假日休息