假设某数据集的原始熵值为0.7, 已知某属性的信息增益为0.2,那么利用该属性进行划分后数据集的熵值为:
0.5
举一反三
- 假设某数据集的原始熵值为0.7,已知某属性的信息增益为0.2,那么利用该属性进行划分后数据集的熵值为 A: 0.9 B: 0.7 C: 0.5 D: 0.2
- ID3算法中,关于使用某个描述属性所能获得的"信息增益”,以下说法正确的是 A: 信息增益=使用该描述属性划分后得到的熵值 B: 信息增益=分类期望-使用该描述属性划分后得到的熵值 C: 信息增益=该描述属性划分后得到的子集数量 D: 信息增益=分类期望-该描述属性划分后得到的子集数量
- 如果类别分布的信息熵是0.301,给定属性A的条件熵为0.2007,给定属性B的条件熵为0.1495,那么下列说法正确的是?( ) A: 属性A的信息增益小于属性B B: 属性B带来的信息多于属性A C: 属性A带来的信息多于属性B D: 属性A的信息增益大于属性B
- 决策树中一般采用“信息增益”对属性进行排序,以下关于“信息增益”描述正确的是( )。 A: 如果一个属性执行后,使得数据集上的信息增益越大,该属性越优先执行 B: 如果一个属性执行后,使得数据集上的信息增益越小,该属性越优先执行 C: “信息增益”对属性排序的差异不影响决策树的结果 D: 以上都不对
- 信息增益算法有误的一步是() A: 输入:训练数据集D和特征A B: (1)计算数据集D的经验熵H(D) C: (2)计算特征A对数据集 D: 的经验熵H(A)<br>D 输出信息增益g(D,A)
内容
- 0
C4.5决策树学习算法以( )为准则划分属性。 A: 增益率 B: 信息熵 C: 基尼系数 D: 信息增益
- 1
ID3决策树算法以()为准则来选择划分属性 A: 信息增益 B: 信息熵 C: 基尼系数 D: 信息增益率
- 2
ID3决策树学习算法以( )为准则来选择划分属性。 A: 信息增益 B: 基尼系数 C: 信息熵 D: 增益率
- 3
【填空题】已知如图所示有 14 行数据,每个数据 4 个特征: 年龄、收入水平、有固定收入、 VIP ,令 C1 对应 " 是 " , C2 对应 " 否 " 。那么 C1 有【 1 】个样本, C2 有【 2 】个样本,所以数据集 D 的熵为【 3 】。若以 " 年龄 " 作为分裂属性,则产生三个子集(因为该属性有三个不同的取值),所以 D 按照属性 " 年龄 " 划分出的三个子集的熵的加权和为【 4 】,若以 " 收入水平 " 为分裂属性,划分出的三个子集的熵的加权和为【 5 】,若以 " 有固定收入 " 为分裂属性,划分出的三个子集的熵的加权和为【 6 】,若以 "VIP" 为分裂属性,划分出的三个子集的熵的加权和为【 7 】,根据结果构造的决策树为以【 8 】作为根节点。(上述数据结果保留两位小数)
- 4
决策树分裂属性的选择以什么为依据? A: 信息增益 B: 数据集分裂的个数 C: 目标属性取值的标准差 D: 目标属性的大小