下列关于缺失值的说法错误的是( )。
A: 可以利用统计量对缺失值进行填补
B: 可以利用 K 近邻值对缺失值进行填补
C: 只要有缺失值就必须把对应记录删除
D: 对于缺失值较多的属性可以考虑删除
A: 可以利用统计量对缺失值进行填补
B: 可以利用 K 近邻值对缺失值进行填补
C: 只要有缺失值就必须把对应记录删除
D: 对于缺失值较多的属性可以考虑删除
举一反三
- 在进行缺失值填补时,若数据呈明显的偏态分布,则可考虑采用下列哪种方法?() A: 将存在缺失值的样本删除 B: 将存在缺失值的变量删除 C: 中位数填补 D: 均值填补
- 可以使用下列那种方式填充缺失值( ) A: 利用缺省值填充缺失值。 B: 人工填充缺失值。 C: 利用临近值填充缺失值。 D: 利用平均值或者中位数填充缺失值。
- 对缺失数据进行插补的方法都有哪些() A: 删除包含缺失值的观测 B: 成对删除法 C: 用最高频率值来填补缺失值 D: 回归插补
- 下列对于缺失值的处理方式中,不正确的是? A: 删除缺失值 B: 忽略缺失值 C: 利用回归模型填充 D: 利用EM模型填充
- 数据集很大、缺失很多值的时候可以使用人工填写缺失值的方法填补缺失值。