一趟聚类算法采用摘要信息CSI表示一个簇,及定义距离度量方法,其将数据集分割为半径几乎相同的超球体(簇)。__
举一反三
- 层次聚类算法中簇间距离度量方法有( )。
- 有一数据集,包含五个样本A、B、C、D、E,样本间距离如下表所示,使用AGNES算法进行聚类,以最小距离计算簇间的距离,最终要求的簇的数量k=2。最终的聚类结果为 ______ ______ 和 ______ 。
- 在层次聚类中,关键是如何度量两个簇的距离,由于簇是一个集合,因此要采用关于集合的某种距离;
- 将每个样本都做为一个独立的类簇,然后按照距离度量原则,不断合并最近的类簇,直至所有样本都合并为一个类簇,或者满足终止条件,这种聚类方式称为( ) A: 基于分割的聚类 B: 层次聚类 C: 基于密度的聚类 D: 基于模型的聚类
- 使用DBSCAN算法对鸢尾花数据集(Iris.arff)进行聚类,将epsilon参数设置为0.2, minPoints参数设置为5,忽略class属性,那么将形成()个簇。