关于数据预处理对聚类分析的影响的错误说法是
A: 可能改变数据点之间的位置关系
B: 可能改变簇的个数
C: 有助于提升聚类质量
D: 可能产生不确定影响
A: 可能改变数据点之间的位置关系
B: 可能改变簇的个数
C: 有助于提升聚类质量
D: 可能产生不确定影响
举一反三
- 关于数据预处理对聚类分析的影响的错误说法是:
- 有关聚类分析,下列说法错误的是哪个? A: 在聚类分析中,簇之间的相似性越小,簇内样本的差别越小,聚类的效果就越好。 B: 聚类分析是一种非监督的过程。 C: K均值算法是一种常用的聚类算法,簇的个数算法不能自动确定。 D: K均值算法的计算耗时与初始假设聚类中心的位置无关。
- 在Sequential Leader算法中: A: 需对数据集进行多次遍历 B: 无法人为控制最终聚类的个数 C: 需要事先生成初始中心点 D: 聚类结果可能受数据访问顺序影响
- 关于k均值聚类算法下列说法错误的是() A: 根据样本到聚类中心点的距离决定样本所在的簇 B: 簇的个数算法不能自动确定 C: 初始假设聚类中心点不同可能导致不同的聚类结果 D: 初始假设聚类中心点必须设置在真实中心点附近
- 有关数据质量不正确的说法是? A: 错误的数据将可能产生有害于决策的结果 B: 因为数据量很大,所以数据质量差一些也对机器学习没多大影响 C: 数据预处理的重要目的是提高机器学习结果的质量 D: 从业务系统提取的脏数据需要预处理才能进行建模工作