【集成学习系列教程5】LightGBM
1.7 LightGBM1.7.1 概述前面我们介绍了AdaBoost和GBDT这两种Boosting方法,它们已经在很多问题上发挥了强大的威力,也已经具有较好效率。但是,如今的数据集正在朝着样本数越来越巨大,特征维度也越来越高的方向发展,此时这两种传统的Boosting方法在效率和可扩展性上已经不能满足现在的需求了。主要原因是:传统的Boosting算法中的基学习器需要通过对所有样本点的每一个特征都进行扫描来计算信息增益,进而找到最佳的分割点,这在样本数和特征数巨大的情况下会相当耗时。为了解决传统Bo