社区
C++ 语言
帖子详情
急急~~在决策树中 关于算Gain 的问题
randomblbl
2008-03-03 01:36:19
我要把3种花分类(A类花,B类花,C类花),4个属性:
如下: 开始是三种花各有50个;
花瓣长度
小于等于3.2 / \ 大于3.2
/ \
结果: A类:20个 A类:30个
B:40个 B: 10个
C:40个 C: 10个
因为是分出来之后是3种,就不知道怎么算了。
在这里怎么算gain啊?
...全文
89
4
打赏
收藏
急急~~在决策树中 关于算Gain 的问题
我要把3种花分类(A类花,B类花,C类花),4个属性: 如下: 开始是三种花各有50个; 花瓣长度 小于等于3.2 / \ 大于3.2 / \ 结果: A类:20个 A类:30个 B:40个 B: 10个 C:40个 C: 10个 因为是分出来之后是3种,就不知道怎么算了。 在这里怎么算gain啊?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
4 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
randomblbl
2008-03-03
打赏
举报
回复
就是训练集数据中 50个A类,50个是B类,50个是c 类,四个属性是花瓣长度,宽度,花枝长度,叶子宽度。
样本数据为
例如;花瓣长度,宽度,花枝长度,叶子宽度, 类型
2.4 0.2 5.0 0.6 A
2.9 0.3 5.1 0.4 A
3.8 0.6 4.2 0.2 B
..........
我先只取了一个属性去分类,求出信息增益度(Gain),但是不知道我求的对不对。~~·
帮忙啊~~~~~~~~~~
dubiousway
2008-03-03
打赏
举报
回复
什么是gain 啊?那4个属性和gain 什么关系?也没看到什么4个属性啊,你的Gain 公式又是怎么回事啊。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。 lz, 俺都不明白
liufangbj
2008-03-03
打赏
举报
回复
没有明白楼主的题目
randomblbl
2008-03-03
打赏
举报
回复
Gain= I(花瓣长度)-100/150*I(左孩子)-50/150*I(右孩子)
I(花瓣长度)= -( 1/3*log2(1/3) + 1/3*log2(1/3) + 1/3*log2(1/3) )
I(左孩子)= -(20/100*log2(20/100) + 40/100*log2(40/100) + 40/100*log2(40/100))
I(右孩子)= -(30/50*log2(30/50) + 10/50*log2(10/50) + 10/50*log2(10/50))
这样对不对啊?
相关推荐
ML (8) - DesicionTree
决策树
决策树
决策树
基本概念选取划分特征
算
法信息熵 (Information Entropy)信息增益 (Information
Gain
)增益率 (
Gain
Ratio)选取划分特征方式
决策树
基本概念 通过一系列节点判断,得到最终的结果。 例如鸢尾花数据集,仅取两个特征:
决策树
为非参数学习
算
法,天然的可解决多分类
问题
,不需使用OvR、OvO等策略。 同样也可以解决回归
问题
。 构建一个
决策树
,主...
决策树
相关
算
法
本博文记录
决策树
相关
算
法原理,用来对付面试
问题
…
决策树
决策树
信息熵: entropy(D)=−∑i=1nPilog2Pientropy(D) = -\sum_{i=1}^n P_ilog_2 P_ientropy(D)=−∑i=1nPilog2Pi
Gain
(A)=entropy(D)−entropyA(D)
Gain
(A) = entropy(D) - entropy_A(D)
Gain
...
面试官:听说你还不知道条件熵是什么?
大家好,我是Xueliang。 想起来去年我参加秋招的时候有一位面试官问我
决策树
相关的
问题
。
决策树
中
有一个概念叫做信息增益,其计
算
公式如下:
Gain
(Y,X)=H(Y)−H(Y∣X)
Gain
(Y,X)=H(Y)-H(Y|X)
Gain
(Y,X)=H(Y)−H(Y∣X) 面试官问我,在一个具体的
问题
里,条件熵H(Y∣X)H(Y|X)H(Y∣X)是怎么计
算
的,以及它的含义是什么呢? 本文内容大约1k字,阅读耗时大约5分钟。 本篇文章主要分为两个部分: 信息熵 条件熵 信息熵 在
决策树
算
法
中
,熵是一个非常
吃瓜笔记--西瓜书学习笔记第四章
决策树
第四章:
决策树
4.1 基本流程 4.1.1
决策树
的结构 4.1.2
决策树
学习基本
算
法 4.2 划分选择 4.2.1
决策树
学习的关键 4.2.2 信息增益(information
gain
) 信息熵 属性a的信息增益
Gain
(D,a)
Gain
(D,a)
Gain
(D,a) 4.2.3 增益率(
gain
ratio) 4.2.4 基尼指数(Gini index) 基尼值 基尼指数(Gini index) 4.3 剪枝处理(
决策树
对付过拟合的主要手段) 4.3.1 预剪枝(prepruning) 4.3.2
有关
决策树
的信息增益
gain
,gini,radio
有关
决策树
的信息增益
gain
,gini,radio
C++ 语言
63,606
社区成员
250,397
社区内容
发帖
与我相关
我的任务
C++ 语言
C++ 语言相关问题讨论,技术干货分享,前沿动态等
复制链接
扫一扫
分享
社区描述
C++ 语言相关问题讨论,技术干货分享,前沿动态等
c++
技术论坛(原bbs)
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
请不要发布与C++技术无关的贴子
请不要发布与技术无关的招聘、广告的帖子
请尽可能的描述清楚你的问题,如果涉及到代码请尽可能的格式化一下