PPV课数据科学社区哪些机器学习算法在小数据集下也表现极佳？

哪些机器学习算法在小数据集下也表现极佳？

ppvke • 2017年3月1日 am12:00 • 数据分析

哪些机器学习算法在小数据集下也表现极佳？

作者：Xavier Amatriain ，前ML研究员，目前在Quora负责工程技术

为了理解这个问题的答案你需要知道两个基本常识：

1）从贝叶斯的角度看，如果你没有大数据，你应该相信你之前使用的任何一个模型；

2）从机器学习的角度来看，小数据最好采用低复杂性（或高偏差）模型，以避免数据过度拟合。

总之，如果你的数据集很小，你应该选择参数少、低复杂性的模型或你之前使用的任何一个模型。

以下这几个都是小数据情况下可以考虑的模型：

1）线性模型：如线性/逻辑回归模型，这个模型对多参数和少量参数都能很好的适应；

2）简单的贝叶斯模型：如朴素贝叶斯，这个模型只需要很少的参数，很容易往任何一种你之前使用的模型方向去调整。

3）另外，正如“小数据学习：小数据训练情况下分类器比较”一文所示，支持向量机在某些条件下可以表现良好。

PPV课翻译小组译转载请联系授权

翻译好文：

译：支持向量机（SVM）及其参数调整的简单教程（Python和R）

译文：朴素贝叶斯算法简介（Python和R中的代码）

网课推荐

机器学习和深度学习网课拼团冲击100人，低至299，符合条件可免费上课！

点击图片了解

原文始发于微信公众号（PPV课数据科学社区）：哪些机器学习算法在小数据集下也表现极佳？

原创文章，作者：ppvke，如若转载，请注明出处：http://www.ppvke.com/archives/3977

哪些机器学习算法在小数据集下也表现极佳？