离群点诊断可以看作是在给定的数据集合中定义离群点,并找到一个有效的方法来挖掘出这样的离群点
举一反三
- 离群点分为全局离群点,( )。 A: 部分离群点和条件离群点 B: 条件离群点和集体离群点 C: 部分离群点和集体离群点 D: 异常离群点和集体离群点
- 下列关于离群点说法错误的是( )。 A: 数据集可能有多种类型的离群点 B: 给定一个数据集,数据对象的一个子集作为整体显著偏离整个数据集,数据对象的这个子集称为集体离群点 C: 如果一个数据对象显著的偏离数据集的其余部分,则这个数据对象为全局离群点 D: 一个对象只属于一种类型的离群点
- 下列关于离群点检测方法的说法中错误的是( )。 A: 基于统计的离群点检测在数据不充分的情况下,能保证所有离群点被发现 B: 基于距离的离群检测的缺点是不能处理不同密度区域的数据集 C: 基于密度的局部离群点检测能在样本空间数据分布不均匀的情况下也可以准确发现离群点 D: 基于密度的离群点检测使用每个对象到第k个最近邻的距离大小来度量密度
- 一个对象的离群点得分是该对象周围密度的逆。这是基于的离群点定义
- 如果一个对象不强属于任何簇,那么该对象是( )。 A: 基于距离的离群点 B: 基于统计的离群点 C: 基于聚类的离群点 D: 基于密度的离群点