【多选题】以下描述,()是正确的。
A. 十折交叉验证使得训练数据集与测试数据集不同
B. SimpleKMeans聚类器适用于处理标称型属性
C. SSE值越小,表明聚类质量越低
D. 使用聚类器时,参数ɛ对聚类的结果有很大的影响
E. 某些算法只能处理标称型属性,如EM算法
A. 十折交叉验证使得训练数据集与测试数据集不同
B. SimpleKMeans聚类器适用于处理标称型属性
C. SSE值越小,表明聚类质量越低
D. 使用聚类器时,参数ɛ对聚类的结果有很大的影响
E. 某些算法只能处理标称型属性,如EM算法
举一反三
- 使用SimpleKMeans聚类器对鸢尾花数据集(iris.arff)进行聚类,...,从结果中可知,下列选项中,()是错误。
- 使用SimpleKMeans聚类器对鸢尾花数据集(iris.arff)进行聚类,保持默认参数,即3个簇以及欧氏距离。忽略class属性,从结果中可知,下列选项中,( )是错误。
- 同样的数据集采用不同的聚类算法,其聚类结果也往往不相同,甚至采用相同类型的聚类算法,选用不同的参数,结果也很不一样。 ( )
- 【多选题】根据聚类的对象不同,聚类可以分为()和() A. 样品聚类 B. Q-型聚类 C. 变量聚类 D. R-型聚类
- 使用KMEANS、DBSCAN等多种聚类算法对同一数据集进行聚类时,可能会得到不同的分组数(类数),分组数较多的聚类算法一般是比较好的。