基于邻近度的异常检测算法的局限性有哪些?( )
A: 对参数k选择敏感,如k太小,少量的邻近点导致离群点得分较低,而k太大,则点数少于k的数据点都可能成为离群点
B: 参数k选择困难
C: 高维空间里,数据是稀疏的,邻近度变得没意义
D: 对于高维数据难以估算其真实分布
A: 对参数k选择敏感,如k太小,少量的邻近点导致离群点得分较低,而k太大,则点数少于k的数据点都可能成为离群点
B: 参数k选择困难
C: 高维空间里,数据是稀疏的,邻近度变得没意义
D: 对于高维数据难以估算其真实分布
举一反三
- 在基于邻近度的方法中,离群点的定义不包括以下哪个?( ) A: 在距离D内,最近邻点数少于P的数据点为离群点 B: 一个对象的离群点得分是该对象周围密度的逆 C: 到第K个最近邻的距离最大的前n个数据点为离群点 D: 到K个最近邻平均距离最大的前n个数据点为离群点
- 个对象的离群点得分是该对象周围密度的逆。这是基于()的离群点定义。 A: 概率 B: 邻近度 C: 密度 D: 聚类
- KNN算法是K邻近算法
- 下列关于离群点检测方法的说法中错误的是( )。 A: 基于统计的离群点检测在数据不充分的情况下,能保证所有离群点被发现 B: 基于距离的离群检测的缺点是不能处理不同密度区域的数据集 C: 基于密度的局部离群点检测能在样本空间数据分布不均匀的情况下也可以准确发现离群点 D: 基于密度的离群点检测使用每个对象到第k个最近邻的距离大小来度量密度
- KNN算法是K邻近算法,常被用于分类问题的算法;是非参数、基于实例的算法。这种说法是否正确?