在进行缺失值填补时,若数据呈明显的偏态分布,则可考虑采用下列哪种方法?()
A: 将存在缺失值的样本删除
B: 将存在缺失值的变量删除
C: 中位数填补
D: 均值填补
A: 将存在缺失值的样本删除
B: 将存在缺失值的变量删除
C: 中位数填补
D: 均值填补
举一反三
- 下列关于缺失值的说法错误的是( )。 A: 可以利用统计量对缺失值进行填补 B: 可以利用 K 近邻值对缺失值进行填补 C: 只要有缺失值就必须把对应记录删除 D: 对于缺失值较多的属性可以考虑删除
- 某大样本数据集的缺失值占比约10%。数据分析师小A首先删除了所有有缺失值的样本,建立了回归模型。然后用某种方法进行了缺失值处理后,重新建立了回归模型,发现模型的VIF值较之前有了很大的增幅。请问小A有可能采用的哪种方法进行的缺失值处理?() A: 均值填补 B: K-means聚类填补 C: 回归填补 D: 忽略缺失值的极大似然估计
- 对缺失数据进行插补的方法都有哪些() A: 删除包含缺失值的观测 B: 成对删除法 C: 用最高频率值来填补缺失值 D: 回归插补
- 数据集很大、缺失很多值的时候可以使用人工填写缺失值的方法填补缺失值。
- 以下哪一项不是SPSS缺失值处理方法() A: 根据调查需要进行填补 B: 剔除有缺失值的观测单位 C: 对缺失值进行估计后补上 D: 将缺失值作为常数值