在基于邻近度的方法中,离群点的定义不包括以下哪个?( )
A: 在距离D内,最近邻点数少于P的数据点为离群点
B: 一个对象的离群点得分是该对象周围密度的逆
C: 到第K个最近邻的距离最大的前n个数据点为离群点
D: 到K个最近邻平均距离最大的前n个数据点为离群点
A: 在距离D内,最近邻点数少于P的数据点为离群点
B: 一个对象的离群点得分是该对象周围密度的逆
C: 到第K个最近邻的距离最大的前n个数据点为离群点
D: 到K个最近邻平均距离最大的前n个数据点为离群点
B
举一反三
- 下列关于离群点检测方法的说法中错误的是( )。 A: 基于统计的离群点检测在数据不充分的情况下,能保证所有离群点被发现 B: 基于距离的离群检测的缺点是不能处理不同密度区域的数据集 C: 基于密度的局部离群点检测能在样本空间数据分布不均匀的情况下也可以准确发现离群点 D: 基于密度的离群点检测使用每个对象到第k个最近邻的距离大小来度量密度
- 个对象的离群点得分是该对象周围密度的逆。这是基于()的离群点定义。 A: 概率 B: 邻近度 C: 密度 D: 聚类
- 基于距离方法的两种不同策略:①采用给定邻域半径,依据点的邻域中包含的对象多少来判定离群点。②利用k最近邻距离的大小来判定离群。
- 一个对象的离群点得分是该对象周围密度的逆。这是基于的离群点定义
- 如果一个对象不强属于任何簇,那么该对象是( )。 A: 基于距离的离群点 B: 基于统计的离群点 C: 基于聚类的离群点 D: 基于密度的离群点
内容
- 0
当数据集包含不同密度的区域时,基于距离的离群点检测方法不能很好地识别离群点。( )
- 1
基于邻近度的异常检测算法的局限性有哪些?( ) A: 对参数k选择敏感,如k太小,少量的邻近点导致离群点得分较低,而k太大,则点数少于k的数据点都可能成为离群点 B: 参数k选择困难 C: 高维空间里,数据是稀疏的,邻近度变得没意义 D: 对于高维数据难以估算其真实分布
- 2
下列关于离群点说法错误的是( )。 A: 数据集可能有多种类型的离群点 B: 给定一个数据集,数据对象的一个子集作为整体显著偏离整个数据集,数据对象的这个子集称为集体离群点 C: 如果一个数据对象显著的偏离数据集的其余部分,则这个数据对象为全局离群点 D: 一个对象只属于一种类型的离群点
- 3
离群点诊断可以看作是在给定的数据集合中定义离群点,并找到一个有效的方法来挖掘出这样的离群点
- 4
在基于聚类的离群点检测中,对象是否被认为是离群点可能高度依赖于簇的个数。( )