• 2021-04-14
    假设某数据集的原始熵值为0.7, 已知某属性的信息增益为0.2,那么利用该属性进行划分后数据集的熵值为:
  • 0.5

    内容

    • 0

      C4.5决策树学习算法以( )为准则划分属性。 A: 增益率 B: 信息熵 C: 基尼系数 D: 信息增益

    • 1

      ID3决策树算法以()为准则来选择划分属性 A: 信息增益 B: 信息熵 C: 基尼系数 D: 信息增益率

    • 2

      ID3决策树学习算法以( )为准则来选择划分属性。 A: 信息增益 B: 基尼系数 C: 信息熵 D: 增益率

    • 3

      【填空题】已知如图所示有 14 行数据,每个数据 4 个特征: 年龄、收入水平、有固定收入、 VIP ,令 C1 对应 " 是 " , C2 对应 " 否 " 。那么 C1 有【 1 】个样本, C2 有【 2 】个样本,所以数据集 D 的熵为【 3 】。若以 " 年龄 " 作为分裂属性,则产生三个子集(因为该属性有三个不同的取值),所以 D 按照属性 " 年龄 " 划分出的三个子集的熵的加权和为【 4 】,若以 " 收入水平 " 为分裂属性,划分出的三个子集的熵的加权和为【 5 】,若以 " 有固定收入 " 为分裂属性,划分出的三个子集的熵的加权和为【 6 】,若以 "VIP" 为分裂属性,划分出的三个子集的熵的加权和为【 7 】,根据结果构造的决策树为以【 8 】作为根节点。(上述数据结果保留两位小数)

    • 4

      决策树分裂属性的选择以什么为依据? A: 信息增益 B: 数据集分裂的个数 C: 目标属性取值的标准差 D: 目标属性的大小