下列关于聚类的质量评价说法正确的是()。
A: 簇的数目k取值可以通过数据集分布的形状和尺度,以及用户要求的聚类分辨率来进行估计。
B: 聚类精度方法中J(C) 值越大,其聚类C相对于基准T的聚类质量就越高。
C: CH指标可以用来评价两个算法所得聚类哪个更好(簇都等于k),以及评价同一算法所得两个簇数不同的聚类哪个更好。
D: 簇的数目k对聚类结果影响不大,可以任意选择。
A: 簇的数目k取值可以通过数据集分布的形状和尺度,以及用户要求的聚类分辨率来进行估计。
B: 聚类精度方法中J(C) 值越大,其聚类C相对于基准T的聚类质量就越高。
C: CH指标可以用来评价两个算法所得聚类哪个更好(簇都等于k),以及评价同一算法所得两个簇数不同的聚类哪个更好。
D: 簇的数目k对聚类结果影响不大,可以任意选择。
举一反三
- DBSCAN聚类和K-Medians聚类都需要预先指定聚类的簇的数目
- 下列关于层次聚类的表述正确的是 A: 层次聚类在不同层级上对数据样本进行聚类,逐步形成树状结构 B: 层次聚类可分为分拆式聚类和聚合式聚类两种基本方法 C: 聚合式聚类为自下而上将小簇聚为大簇 D: 分拆式聚类为自下而上将大簇拆分为小簇
- 下面哪些聚类方法易于发现特殊形状的簇? A: k均值聚类 B: 层次聚类 C: DBSCAN D: 基于密度的聚类方法
- 关于k均值聚类算法下列说法错误的是() A: 根据样本到聚类中心点的距离决定样本所在的簇 B: 簇的个数算法不能自动确定 C: 初始假设聚类中心点不同可能导致不同的聚类结果 D: 初始假设聚类中心点必须设置在真实中心点附近
- 将含有多个对象的数据集划分成若干个簇,使每个数据对象都属于且只属于一个簇,同时聚类簇的总数目小于数据对象的总数目,这种聚类类型称作 A: 基于层次的聚类 B: 基于网格的聚类 C: 基于划分的聚类 D: 基于密度的聚类