作者:Xavier Amatriain ,前ML研究员,目前在Quora负责工程技术
为了理解这个问题的答案你需要知道两个基本常识:
1)从贝叶斯的角度看,如果你没有大数据,你应该相信你之前使用的任何一个模型;
2)从机器学习的角度来看,小数据最好采用低复杂性(或高偏差)模型,以避免数据过度拟合。
总之,如果你的数据集很小,你应该选择参数少、低复杂性的模型或你之前使用的任何一个模型。
以下这几个都是小数据情况下可以考虑的模型:
1)线性模型:如线性/逻辑回归模型,这个模型对多参数和少量参数都能很好的适应;
2)简单的贝叶斯模型:如朴素贝叶斯,这个模型只需要很少的参数,很容易往任何一种你之前使用的模型方向去调整。
3)另外,正如“小数据学习:小数据训练情况下分类器比较”一文所示,支持向量机在某些条件下可以表现良好。
PPV课翻译小组译 转载请联系授权
翻译好文:
网课推荐
机器学习和深度学习网课拼团冲击100人,低至299,符合条件可免费上课!
点击图片了解
原文始发于微信公众号(PPV课数据科学社区):哪些机器学习算法在小数据集下也表现极佳?
原创文章,作者:ppvke,如若转载,请注明出处:http://www.ppvke.com/archives/3977