基于距离方法的两种不同策略:①采用给定邻域半径,依据点的邻域中包含的对象多少来判定离群点。②利用k最近邻距离的大小来判定离群。
正确
举一反三
- 在基于邻近度的方法中,离群点的定义不包括以下哪个?( ) A: 在距离D内,最近邻点数少于P的数据点为离群点 B: 一个对象的离群点得分是该对象周围密度的逆 C: 到第K个最近邻的距离最大的前n个数据点为离群点 D: 到K个最近邻平均距离最大的前n个数据点为离群点
- 下列关于离群点检测方法的说法中错误的是( )。 A: 基于统计的离群点检测在数据不充分的情况下,能保证所有离群点被发现 B: 基于距离的离群检测的缺点是不能处理不同密度区域的数据集 C: 基于密度的局部离群点检测能在样本空间数据分布不均匀的情况下也可以准确发现离群点 D: 基于密度的离群点检测使用每个对象到第k个最近邻的距离大小来度量密度
- 当数据集包含不同密度的区域时,基于距离的离群点检测方法不能很好地识别离群点。( )
- 如果一个对象不强属于任何簇,那么该对象是( )。 A: 基于距离的离群点 B: 基于统计的离群点 C: 基于聚类的离群点 D: 基于密度的离群点
- 关于离群点的判定:
内容
- 0
给定邻域\(U(2,1)\),其中邻域中___________ , 邻域半径是_____________ .
- 1
从基于密度的观点来说,离群点是在______ 区域中的对象。
- 2
K最近邻算法步骤包括 A: 算距离:给定测试对象,计算它与训练集中的每个对象的距离 B: 找邻居:圈定距离最近的k个训练对象,作为测试对象的近邻 C: 做分类:根据这k个近邻归属的主要类别,来对测试对象分类
- 3
一个对象的离群点得分是该对象周围密度的逆。这是基于的离群点定义
- 4
给定邻域 \(U(2,1)\),其中邻域中心是 , ______ 邻域半径是 . ______