关于KNN算法的叙述正确的是( )。
A: 算法的关键在于“计算新增数据特征与已有样本特征之间的相似度”。
B: K值是分类的类别值。
C: 计算特征之间的相似度的方法有很多,最基本且最常用的方法就是距离法。
D: 算法应用的前提条件是在训练集及其每个样本的分类标签信息为已知。
A: 算法的关键在于“计算新增数据特征与已有样本特征之间的相似度”。
B: K值是分类的类别值。
C: 计算特征之间的相似度的方法有很多,最基本且最常用的方法就是距离法。
D: 算法应用的前提条件是在训练集及其每个样本的分类标签信息为已知。
举一反三
- 数据挖掘算法中,( )算法的关键在于“计算新增数据的特征与已有样本特征之间的相似度”,广泛应用于相似性推荐。 A: K-Means算法 B: KNN算法 C: ID3算法 D: Apriori算法
- 对于层次聚类算法,其关键是定义簇之间的相似度,并使用已知类别标签的样本计算簇之间的相似度。
- 对于层次聚类算法,其关键是定义簇之间的相似度,并使用已知类别标签的样本计算簇之间的相似度。 A: 正确 B: 错误
- KNN算法的分类原理有()。 A: 把已经分类或需要分类的样本在定义的特征空间上表征 B: 需要分类的样本选择特征空间上和自己最邻近的K个样本 C: 需要分类的样本的类别就是这K个样本中最多的那个类别
- 层次凝聚式聚类(HAC)算法中,单连接方法计算样本间的最短距离,即最大相似度;全连接方法计算样本间的最长距离,即最小相似度。