假设某数据集的原始熵值为0.7,已知某属性的信息增益为0.2,那么利用该属性进行划分后数据集的熵值为
A: 0.9
B: 0.7
C: 0.5
D: 0.2
A: 0.9
B: 0.7
C: 0.5
D: 0.2
C
举一反三
- 假设某数据集的原始熵值为0.7, 已知某属性的信息增益为0.2,那么利用该属性进行划分后数据集的熵值为:
- ID3算法中,关于使用某个描述属性所能获得的"信息增益”,以下说法正确的是 A: 信息增益=使用该描述属性划分后得到的熵值 B: 信息增益=分类期望-使用该描述属性划分后得到的熵值 C: 信息增益=该描述属性划分后得到的子集数量 D: 信息增益=分类期望-该描述属性划分后得到的子集数量
- 薄层色谱中,供试品比移值(Rf)的最佳范围为() A: 0.3~0.5 B: 0.2~0.8 C: 0.3~0.7 D: 0.1~0.9 E: 0.2~0.9
- 择伐后林分郁闭度以()为宜。 A: 0.8~0.9 B: 0.6~0.7 C: 0.2~0.3 D: 0.4~0.5
- 如果类别分布的信息熵是0.301,给定属性A的条件熵为0.2007,给定属性B的条件熵为0.1495,那么下列说法正确的是?( ) A: 属性A的信息增益小于属性B B: 属性B带来的信息多于属性A C: 属性A带来的信息多于属性B D: 属性A的信息增益大于属性B
内容
- 0
决策树中一般采用“信息增益”对属性进行排序,以下关于“信息增益”描述正确的是( )。 A: 如果一个属性执行后,使得数据集上的信息增益越大,该属性越优先执行 B: 如果一个属性执行后,使得数据集上的信息增益越小,该属性越优先执行 C: “信息增益”对属性排序的差异不影响决策树的结果 D: 以上都不对
- 1
薄层色谱中,供试品的比移值(Rf)的可用范围为()。 A: 0.3~0.5 B: 0.2~0.8 C: 0.3~0.7 D: 0.1~0.9
- 2
薄层色谱中,供试品的比移值(Rf)的最佳范围为()。 A: 0.3~0.5 B: 0.2~0.8 C: 0.3~0.7 D: 0.1~0.9
- 3
信息增益算法有误的一步是() A: 输入:训练数据集D和特征A B: (1)计算数据集D的经验熵H(D) C: (2)计算特征A对数据集 D: 的经验熵H(A)<br>D 输出信息增益g(D,A)
- 4
使用DBSCAN算法对鸢尾花数据集(Iris.arff)进行聚类,将epsilon参数设置为0.2, minPoints参数设置为5,忽略class属性,那么将形成()个簇。