1. 首页
  2. 数据分析

哪些机器学习算法在小数据集下也表现极佳?

哪些机器学习算法在小数据集下也表现极佳?

 

作者:Xavier Amatriain ,前ML研究员,目前在Quora负责工程技术

 

为了理解这个问题的答案你需要知道两个基本常识:

1)从贝叶斯的角度看,如果你没有大数据,你应该相信你之前使用的任何一个模型;

2)从机器学习的角度来看,小数据最好采用低复杂性(或高偏差)模型,以避免数据过度拟合。

 

总之,如果你的数据集很小,你应该选择参数少、低复杂性的模型或你之前使用的任何一个模型。

 

以下这几个都是小数据情况下可以考虑的模型:

 

1)线性模型:如线性/逻辑回归模型,这个模型对多参数和少量参数都能很好的适应;

2)简单的贝叶斯模型:如朴素贝叶斯,这个模型只需要很少的参数,很容易往任何一种你之前使用的模型方向去调整。

3)另外,正如“小数据学习:小数据训练情况下分类器比较”一文所示,支持向量机在某些条件下可以表现良好。

 

PPV课翻译小组译  转载请联系授权


翻译好文:


网课推荐

机器学习和深度学习网课拼团冲击100人,低至299,符合条件可免费上课!

哪些机器学习算法在小数据集下也表现极佳?

点击图片了解



原文始发于微信公众号(PPV课数据科学社区):哪些机器学习算法在小数据集下也表现极佳?

原创文章,作者:ppvke,如若转载,请注明出处:http://www.ppvke.com/archives/3977

联系我们

4000-51-9191

在线咨询:点击这里给我发消息

工作时间:周一至周五,9:30-18:30,节假日休息