1. 首页
  2. 数据分析

【对话数据分析师】分析一万多条运输线路的货量,我是这么做的……

点击上方 免费订阅学习)

论坛君:“每天一个数据分析师”第十一期,这次的采访对象是一个热爱数据分析的分析师,对与数据分析有很高的热忱,也乐于与别人分享讨论、互相学习。
人物档案
刘华原
他做数据分析已经有四个年头了,目前在一家互联网上市公司做数据分析师,他说“数据分析师是一个有趣的职业,数据分析的工作内容也同样很有趣,未来希望能在数据分析领域有更多的成就,同时希望能和更多的爱好者一起交流学习。”
DA
您是如何入行的?

刘华原:读大学念的专业是统计学,第一份工作是统计员,主要做绩效核算、生产日报及分析,算是专业对口吧,所以就自然而然的入了行。

DA
说说您的工作经历,目前的工作职责,以及您的职业规划?

刘华原:第一份工作是2011年12月~2012年12月,算是实习,职位是统计员,主要是做绩效核算、生产日报及分析,工具只要是excel,基本没涉及到预测和模型,但算是入了行;第二份工作是2012年12月~2014年12月,在德邦物流做分析师,负责过预算编制,收入分析,收入货量预测等,工具只要是excel、access、ppt和spss等,经常要用到数据模型,以及其他分析方法,算是在数据分析上有了一点积累;目前在一家互联网公司做数据分析,主要是公司的产品、运营、市场等部门的运营分析、效果分析以及网站流量的用户行为分析等,用到的工具有excel、mysql、python等。

未来打算学习hadoop等,在大数据领域有进一步的发展。

DA
在工作中遇到过什么让您印象深刻的困难吗?其背景成因是什么?

刘华原:之前工作中印象最深的困难就是让预测公司一万多条运输线路的货量,主要有三个困难:

  • 工作量大,时间短;

  • 各线路的规律不一样,且有些货量波动较大,不适合精准的模型;

  • 一般的回归、时间序列模型不适合,比较难找到适合的模型。

当时是为了做精准的线路规划,以提高货运卡车的载货量,所以需要每条线路每天的货量预测(滚动预测,提前一周出,每天修正并向前滚动预测),以设计最优的货量周转和发车班次。

DA
如何解决这个问题呢?能否请您向广大同行分享下思路?

刘华原:猛一看一万多条线路确实比较多,在保证精确度的情况下确实比较难做。

我拿到任务后先整体分析了一下数据,发现前1000多条的货量占总货量的80%,所以应该重点预测,保证精确度;其他9000多条线路经分析主要是一些货量非常小,货量波动比较大的线路,因此采用简单的移动平滑法预测,因为线路整体货量较少,基本上均一辆车就可以。

其他1000多条线路经分析存在4天为周期的波动,为了避免波动带来的影响,将历史数据做4天为周期的移动平均,得到一组新数据。

同时根据历史的四个数据预测后一个,给定四个历史数据四个参数a、b、c、d,假设初始值均为1,则预测值下一个为(a*历史值1+b*历史值2+c*历史值3+d*历史值4)/4,计算1000多条线路的绝对平均误差为x,设定为目标函数。

【对话数据分析师】分析一万多条运输线路的货量,我是这么做的……

1、模型构造

在x为最小时,调整a、b、c、d,使绝对平均误差最小。

【对话数据分析师】分析一万多条运输线路的货量,我是这么做的……

2、目标函数和约束条件设计

【对话数据分析师】分析一万多条运输线路的货量,我是这么做的……

3、模型结果

【对话数据分析师】分析一万多条运输线路的货量,我是这么做的……

4、模型构造中的函数公式

这样预测出大部分线路的货量且误差较小,同时可以对个别线路误差大的货量做一定的调整。

DA
您可否推荐一些平时充电学习专业知识的平台或途径?

刘华原:要想做好数据分析,一要熟悉业务,二要有扎实的相关理论知识并熟练掌握一款数据分析软件,例如SQL、SPSS、R和Python。

业务知识需要在相关的工作中补,软件相关有几个网站大家可以找相关资料学习:

SQL: http://www.w3school.com.cn/

R和Python:http://study.163.com/ #网易云课堂

https://www.coursera.org/ #course在线教育

http://www.icourse163.org/ #中国慕课学院

https://www.edx.org/ #edx在线教育

DA
您对希望从事数据分析行业的人有哪些建议?

刘华原:谈不上建议,工作几年的几点感悟,大家可以共勉:

1、业务是数据分析的基础,千万不要脱离业务谈数据分析,不懂业务,好的数据分析技术可能会分析出错误的结论;

2、不要眼高手低,看不上眼前的工作,知识和技巧都是一点点积累的,多想,多做,相信任何工作都会有所收获;

3、要转行的朋友不要老是讲要转行,不知道该怎么做了,现在数据分析越来越火,基本上已经成为企业的标配,基本上任何工作都需要数据分析,所以与其到处说不知道怎么转行,不如着眼于眼前的工作,从数据分析的角度来改善,提高自己的工作,都有了一定的积累,再找更相关的工作。

4、统计学专业或相关专业的朋友不要总是觉得学的东西用不上,等工作久了,会感觉以前学的知识都不够用了。还要不断充电、学习。

未来数据分析行业的就业前景会越来越好,同时企业对数据分析的要求越来越高,只有不断学习才能胜任未来的岗位。

同时数据分析未来会有很多细分岗位,例如运营分析、网站分析、数据产品经理、数据建模、算法设计等等都需要不同的技能和经验,大家可以根据自己的爱好和特长选择适合自己的领域。

来源:CDA数据分析师

【对话数据分析师】分析一万多条运输线路的货量,我是这么做的……

1、回复“数据分析师”查看数据分析师系列文章

2、回复“案例”查看大数据案例系列文章

3、回复“征信”查看相关征信的系列文章

4、回复“可视化”查看可视化专题系列文章

5、回复“SPPS”查看SPSS系列文章

6、回复“答案”查看hadoop面试题题目及答案

7、回复“爱情”查看大数据与爱情的故事

8、回复“笑话”查看大数据系列笑话

9、回复“大数据1、大数据2、大数据3、大数据4”查看大数据历史机遇连载

PPV课大数据ID: ppvke123 (长按可复制)

本公众号专注大数据和数据科学领域,分享领域知识和相关技术文章,探索大数据商业价值,培养和挖掘大数据专业人才,欢迎大家关注!

原文始发于微信公众号(PPV课数据科学社区):【对话数据分析师】分析一万多条运输线路的货量,我是这么做的……

原创文章,作者:ppvke,如若转载,请注明出处:http://www.ppvke.com/archives/17106

联系我们

4000-51-9191

在线咨询:点击这里给我发消息

工作时间:周一至周五,9:30-18:30,节假日休息