2,537
社区成员




a. 用 N 来表示训练用例(样本)的个数, M 表示特征数目。
b. 输入特征数目 m,用于确定决策树上一个节点的决策结果;其中 m 应远小于 M。
c. 从 N 个训练用例(样本)中以有放回抽样的方式,取样 N 次,形成一个训练集(即 bootstrap 取样),并用未抽到的用例(样本)作预测,评估其误差。
d. 对于每一个节点,随机选择 m 个特征,决策树上每个节点的决定都是基于这些特征确定的。根据这 m 个特征,计算其最佳的分裂方式。
e. 每棵树都会完整成长而不会剪枝,这有可能在建完一棵正常树状分类器后被采用)。