下列关于离群点检测方法的说法中错误的是( )。
A: 基于统计的离群点检测在数据不充分的情况下,能保证所有离群点被发现
B: 基于距离的离群检测的缺点是不能处理不同密度区域的数据集
C: 基于密度的局部离群点检测能在样本空间数据分布不均匀的情况下也可以准确发现离群点
D: 基于密度的离群点检测使用每个对象到第k个最近邻的距离大小来度量密度
A: 基于统计的离群点检测在数据不充分的情况下,能保证所有离群点被发现
B: 基于距离的离群检测的缺点是不能处理不同密度区域的数据集
C: 基于密度的局部离群点检测能在样本空间数据分布不均匀的情况下也可以准确发现离群点
D: 基于密度的离群点检测使用每个对象到第k个最近邻的距离大小来度量密度
举一反三
- 当数据集包含不同密度的区域时,基于距离的离群点检测方法不能很好地识别离群点。( )
- 下列属于基于统计的离群点检测流程的是( )。 A: 设定数据集的分布模型 B: 不和谐检验 C: 发现离群点 D: 验证离群点
- 如果一个对象不强属于任何簇,那么该对象是( )。 A: 基于距离的离群点 B: 基于统计的离群点 C: 基于聚类的离群点 D: 基于密度的离群点
- 检测一元正态分布中的离群点,属于异常检测中的基于()的离群点检测。
- 在基于邻近度的方法中,离群点的定义不包括以下哪个?( ) A: 在距离D内,最近邻点数少于P的数据点为离群点 B: 一个对象的离群点得分是该对象周围密度的逆 C: 到第K个最近邻的距离最大的前n个数据点为离群点 D: 到K个最近邻平均距离最大的前n个数据点为离群点