异常值是指一批数据中的个别值,其数值明显偏离该批数据的其余值,也称离群值。
举一反三
- 异常值(Outlier)指样本中的个别值,其数值明显偏离它(或他们)所属样本的其余观测值,也称异常数据,离群值。目前人们对异常值的判别与剔除主要采用物理判别法和统计判别法两种方法。
- 在数据清洗中,异常值指的是( ) A: 指那些偏离正常范围的值,又叫离群点,并不是错误值 B: 异常值出现频率较高,会对实际项目分析造成误差。 C: 表示的是“缺失的数据“ D: 分为单个属性重复和全部属性重复
- 数据精简用来解决原始数据中的噪声和离群值、数值缺失、数值重复等数据质量问题
- 常见的数据质量问题包括()。 A: 噪声 B: 离群值 C: 数据缺失 D: 数值重复
- 一批数据可以有多个指标。以下指标中,( )不宜作为这批数据的代表值。 A: 中位数 B: 众数 C: 平均数 D: 方差