下面关于构建模型树的说法中,错误的是( )。
A: 创建一个结点t,与结点t关联的数据集记为Dt
B: 如果当前结点t所关联的数据集Dt中样本个数小于给定阈值或者Dt中样本的目标属性取值的标准差小于给定阈值,则将该结点标记为叶子节点
C: 在选择分类属性时,应选择时SDR值最小的属性
D: SDR代表误差的期望减少
A: 创建一个结点t,与结点t关联的数据集记为Dt
B: 如果当前结点t所关联的数据集Dt中样本个数小于给定阈值或者Dt中样本的目标属性取值的标准差小于给定阈值,则将该结点标记为叶子节点
C: 在选择分类属性时,应选择时SDR值最小的属性
D: SDR代表误差的期望减少
举一反三
- 下列属于决策树中应该剪枝的情景是( )。 A: 一个结点关联的数据集的信息熵高于指定阈值 B: 一个结点关联的数据集的信息熵低于指定阈值 C: 双亲结点的误差比子女结点的加权误差大 D: 双亲结点的误差比子女结点的平均误差大
- 下列属于决策树中应该剪枝的情景是( )。 A: 一个结点关联的数据集的信息熵高于指定阈值 B: 一个结点关联的数据集的信息熵低于指定阈值 C: 双亲结点的误差比子女结点的加权误差大 D: 双亲结点的误差比子女结点的平均误差大
- 在决策树中,一个数据集的类别属性一般出现在什么结点上? A: 根结点 B: 外部结点 C: 内部结点 D: 叶子结点
- 如果一棵非空k(k≥2)叉树T中每个非叶子结点都有k个孩子,则称T为正则k叉树。若T有m个非叶子结点,则T中的叶子结点个数为:()_
- 在模型树的构建过程中,分裂属性的选择以分裂后的各个子数据集中目标属性取值的标准差为依据,将标准差作为一种误差度量,将分裂前后标准差的减少量作为误差的期望减少,称为SDR。