社区
C++ 语言
帖子详情
急急~~在决策树中 关于算Gain 的问题
randomblbl
2008-03-03 01:36:19
我要把3种花分类(A类花,B类花,C类花),4个属性:
如下: 开始是三种花各有50个;
花瓣长度
小于等于3.2 / \ 大于3.2
/ \
结果: A类:20个 A类:30个
B:40个 B: 10个
C:40个 C: 10个
因为是分出来之后是3种,就不知道怎么算了。
在这里怎么算gain啊?
...全文
84
4
打赏
收藏
急急~~在决策树中 关于算Gain 的问题
我要把3种花分类(A类花,B类花,C类花),4个属性: 如下: 开始是三种花各有50个; 花瓣长度 小于等于3.2 / \ 大于3.2 / \ 结果: A类:20个 A类:30个 B:40个 B: 10个 C:40个 C: 10个 因为是分出来之后是3种,就不知道怎么算了。 在这里怎么算gain啊?
复制链接
扫一扫
分享
举报
写回复
配置赞助广告
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
randomblbl
2008-03-03
打赏
举报
回复
就是训练集数据中 50个A类,50个是B类,50个是c 类,四个属性是花瓣长度,宽度,花枝长度,叶子宽度。
样本数据为
例如;花瓣长度,宽度,花枝长度,叶子宽度, 类型
2.4 0.2 5.0 0.6 A
2.9 0.3 5.1 0.4 A
3.8 0.6 4.2 0.2 B
..........
我先只取了一个属性去分类,求出信息增益度(Gain),但是不知道我求的对不对。~~·
帮忙啊~~~~~~~~~~
dubiousway
2008-03-03
打赏
举报
回复
什么是gain 啊?那4个属性和gain 什么关系?也没看到什么4个属性啊,你的Gain 公式又是怎么回事啊。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。 lz, 俺都不明白
liufangbj
2008-03-03
打赏
举报
回复
没有明白楼主的题目
randomblbl
2008-03-03
打赏
举报
回复
Gain= I(花瓣长度)-100/150*I(左孩子)-50/150*I(右孩子)
I(花瓣长度)= -( 1/3*log2(1/3) + 1/3*log2(1/3) + 1/3*log2(1/3) )
I(左孩子)= -(20/100*log2(20/100) + 40/100*log2(40/100) + 40/100*log2(40/100))
I(右孩子)= -(30/50*log2(30/50) + 10/50*log2(10/50) + 10/50*log2(10/50))
这样对不对啊?
相关推荐
决策树
-上-ID3C45CART及剪枝.pptx
决策树
-上;内容;
决策树
;
决策树
;
决策树
;ID3=>C4.5=>C5.0;ID3/C4.5/C5.0的分类基础;信息增益information
gain
是指期望信息或者信息熵的有效减少量 ;信息增益率information
gain
ratio 由划分个数引起的偏置
问题
划分越多=>引起每个划分内部数据纯度的变化分块越小数据纯度可能越高=>进而引起偏置
问题
设样本集S按离散属性F的V个不同的取值划
ML (8) - DesicionTree
决策树
决策树
决策树
基本概念选取划分特征
算
法信息熵 (Information Entropy)信息增益 (Information
Gain
)增益率 (
Gain
Ratio)选取划分特征方式
决策树
基本概念 通过一系列节点判断,得到最终的结果。 例如鸢尾花数据集,仅取两个特征:
决策树
为非参数学习
算
法,天然的可解决多分类
问题
,不需使用OvR、OvO等策略。 同样也可以解决回归
问题
。 构建一个
决策树
,主...
决策树
相关
算
法
本博文记录
决策树
相关
算
法原理,用来对付面试
问题
…
决策树
决策树
信息熵: entropy(D)=−∑i=1nPilog2Pientropy(D) = -\sum_{i=1}^n P_ilog_2 P_ientropy(D)=−∑i=1nPilog2Pi
Gain
(A)=entropy(D)−entropyA(D)
Gain
(A) = entropy(D) - entropy_A(D)
Gain
...
面试官:听说你还不知道条件熵是什么?
大家好,我是Xueliang。 想起来去年我参加秋招的时候有一位面试官问我
决策树
相关的
问题
。
决策树
中
有一个概念叫做信息增益,其计
算
公式如下:
Gain
(Y,X)=H(Y)−H(Y∣X)
Gain
(Y,X)=H(Y)-H(Y|X)
Gain
(Y,X)=H(Y)−H(Y∣X) 面试官问我,在一个具体的
问题
里,条件熵H(Y∣X)H(Y|X)H(Y∣X)是怎么计
算
的,以及它的含义是什么呢? 本文内容大约1k字,阅读耗时大约5分钟。 本篇文章主要分为两个部分: 信息熵 条件熵 信息熵 在
决策树
算
法
中
,熵是一个非常
吃瓜笔记--西瓜书学习笔记第四章
决策树
第四章:
决策树
4.1 基本流程 4.1.1
决策树
的结构 4.1.2
决策树
学习基本
算
法 4.2 划分选择 4.2.1
决策树
学习的关键 4.2.2 信息增益(information
gain
) 信息熵 属性a的信息增益
Gain
(D,a)
Gain
(D,a)
Gain
(D,a) 4.2.3 增益率(
gain
ratio) 4.2.4 基尼指数(Gini index) 基尼值 基尼指数(Gini index) 4.3 剪枝处理(
决策树
对付过拟合的主要手段) 4.3.1 预剪枝(prepruning) 4.3.2
发帖
C++ 语言
C++ 语言
C++ 语言相关问题讨论,技术干货分享,前沿动态等
复制链接
扫一扫
6.3w+
社区成员
25.0w+
社区内容
C++ 语言相关问题讨论,技术干货分享,前沿动态等
c++
技术论坛(原bbs)
社区管理员
加入社区
获取链接或二维码
帖子事件
创建了帖子
2008-03-03 01:36
社区公告
请不要发布与C++技术无关的贴子
请不要发布与技术无关的招聘、广告的帖子
请尽可能的描述清楚你的问题,如果涉及到代码请尽可能的格式化一下