某大样本数据集的缺失值占比约10%。数据分析师小A首先删除了所有有缺失值的样本,建立了回归模型。然后用某种方法进行了缺失值处理后,重新建立了回归模型,发现模型的VIF值较之前有了很大的增幅。请问小A有可能采用的哪种方法进行的缺失值处理?()
A: 均值填补
B: K-means聚类填补
C: 回归填补
D: 忽略缺失值的极大似然估计
A: 均值填补
B: K-means聚类填补
C: 回归填补
D: 忽略缺失值的极大似然估计
举一反三
- 在进行缺失值填补时,若数据呈明显的偏态分布,则可考虑采用下列哪种方法?() A: 将存在缺失值的样本删除 B: 将存在缺失值的变量删除 C: 中位数填补 D: 均值填补
- 数据集很大、缺失很多值的时候可以使用人工填写缺失值的方法填补缺失值。
- 对缺失数据进行插补的方法都有哪些() A: 删除包含缺失值的观测 B: 成对删除法 C: 用最高频率值来填补缺失值 D: 回归插补
- 对缺失值的处理,最常采用的实用方法是下列哪一种方法? A: 样本平均值 B: 删除 C: 不理它 D: 重新录入所有数据,修正缺失值
- 以下哪一项不是SPSS缺失值处理方法() A: 根据调查需要进行填补 B: 剔除有缺失值的观测单位 C: 对缺失值进行估计后补上 D: 将缺失值作为常数值