1. 首页
  2. 数据分析

一张图看懂算法和数据集的关系

在大数据领域,关于算法和数据集哪个更重要一直有一些争论,本图可以从一个侧面让我们了解这两者之间的关系。

一张图看懂算法和数据集的关系

可以看出对人工智能历史上重大突破有贡献作用的算法提出到真正取得突破,往往需要18年左右的时间,在这18年里,有效的数据集都是出现在最后阶段,从数据集的产生到最后突破,平均不到3年的时间。如隐马尔可夫算法是1984年提出的,可用语音数据集是1991年出现的(来自华尔街口语),1994年诞生了具有真人发音级别的语音识别技术。

不难看出,算法是基石,是奠定重大突破的基础研究;有效的数据集是催化剂和加速器,具有风向标作用;这两个结合才能产生化学反应,诞生重大的技术突破。对于大多数“应用型”的大数据和数据挖掘从业者,尽快基于已有算法去获取有效的数据集吧,站在巨人肩膀上会加速你的成功。而那些大神一样的顶尖数据科学家将会致力于前沿算法和研究,对于他们我们除了仰慕还是仰慕。

本图转自 UC Santa Barbara计算机科学系助理教授 王威廉的博客

PPV课编辑整理,未经许可,严禁转载


原文始发于微信公众号(PPV课数据科学社区):一张图看懂算法和数据集的关系

原创文章,作者:ppvke,如若转载,请注明出处:http://www.ppvke.com/archives/1429

联系我们

4000-51-9191

在线咨询:点击这里给我发消息

工作时间:周一至周五,9:30-18:30,节假日休息