如果类别分布的信息熵是0.301,给定属性A的条件熵为0.2007,给定属性B的条件熵为0.1495,那么下列说法正确的是?( )
A: 属性A的信息增益小于属性B
B: 属性B带来的信息多于属性A
C: 属性A带来的信息多于属性B
D: 属性A的信息增益大于属性B
A: 属性A的信息增益小于属性B
B: 属性B带来的信息多于属性A
C: 属性A带来的信息多于属性B
D: 属性A的信息增益大于属性B
举一反三
- 使用 ID3 算法构建决策树时,选择属性的度量依据是 ( )。 A: 信息熵 B: 信息增益 C: 条件熵 D: 信息增益率
- ID3算法中,关于使用某个描述属性所能获得的"信息增益”,以下说法正确的是 A: 信息增益=使用该描述属性划分后得到的熵值 B: 信息增益=分类期望-使用该描述属性划分后得到的熵值 C: 信息增益=该描述属性划分后得到的子集数量 D: 信息增益=分类期望-该描述属性划分后得到的子集数量
- 不属于常见的属性选择标准的是 A: 信息增益 B: 信息熵 C: 信息增益率 D: Gini系数
- 一个属性的信息增益就是由于使用这个属性分割样例而导致的期望熵降低。
- 假设某数据集的原始熵值为0.7, 已知某属性的信息增益为0.2,那么利用该属性进行划分后数据集的熵值为: