基于距离方法的两种不同策略:①采用给定邻域半径,依据点的邻域中包含的对象多少来判定离群点。②利用k最近邻距离的大小来判定离群。
举一反三
- 在基于邻近度的方法中,离群点的定义不包括以下哪个?( ) A: 在距离D内,最近邻点数少于P的数据点为离群点 B: 一个对象的离群点得分是该对象周围密度的逆 C: 到第K个最近邻的距离最大的前n个数据点为离群点 D: 到K个最近邻平均距离最大的前n个数据点为离群点
- 下列关于离群点检测方法的说法中错误的是( )。 A: 基于统计的离群点检测在数据不充分的情况下,能保证所有离群点被发现 B: 基于距离的离群检测的缺点是不能处理不同密度区域的数据集 C: 基于密度的局部离群点检测能在样本空间数据分布不均匀的情况下也可以准确发现离群点 D: 基于密度的离群点检测使用每个对象到第k个最近邻的距离大小来度量密度
- 当数据集包含不同密度的区域时,基于距离的离群点检测方法不能很好地识别离群点。( )
- 如果一个对象不强属于任何簇,那么该对象是( )。 A: 基于距离的离群点 B: 基于统计的离群点 C: 基于聚类的离群点 D: 基于密度的离群点
- 关于离群点的判定: