在噪声数据中,波动数据比离群点数据偏离整体水平更大。
举一反三
- 下列关于离群点说法错误的是( )。 A: 数据集可能有多种类型的离群点 B: 给定一个数据集,数据对象的一个子集作为整体显著偏离整个数据集,数据对象的这个子集称为集体离群点 C: 如果一个数据对象显著的偏离数据集的其余部分,则这个数据对象为全局离群点 D: 一个对象只属于一种类型的离群点
- 数据精简用来解决原始数据中的噪声和离群值、数值缺失、数值重复等数据质量问题
- 常见的数据质量问题包括()。 A: 噪声 B: 离群值 C: 数据缺失 D: 数值重复
- k-means算法对于噪声和离群点数据不敏感
- 下列论述正确的为( ) A: 离群数据一定是错误数据。 B: 四分位数的一个主要应用领域是离群数据的判断。 C: 落在上下四分位数之外的数据为离群数据。 D: 数据分析过程中一定要删除离群数据。