学习GBDT一直没有搞懂的“权值”问题,望赐教
庶心一旦 2020-04-02 03:21:10 引用一段原文“Boosting初始化时对每一个训练样例赋相等的权重1/n,然后用该算法对训练集训练t轮,每次训练后,对训练失败的样例赋以较大的权重)”
不太明白的是
1.这个权重在生成树时究竟起到什么作用?这个权值是赋值到训练样本的哪个地方,训练样本有很多特征,这个权值是给所有的特征还是?假设我是CART,那权值如何影响树的分裂?
2.训练样本是用来生成树的,那“训练失败的样例”是什么个意思,训练好的树不是用test集来检验的么,怎么又用训练集来检验呢?