数据清理主要清理( )三种情况。
A: 重复值
B: 无效值
C: 错误值
D: 非数值
A: 重复值
B: 无效值
C: 错误值
D: 非数值
举一反三
- 数据录入后的清理包括( )。 A: 数据编码 B: 逻辑一致性清理 C: 有效范围清理 D: 重复值清理
- 数据清理的方法包括以下哪些选项? A: 一致性检查(consistency check) B: 消除重复项 C: 错误值的检测及解决 D: 无效值和缺失值的处理
- 当数据中的某些数值超出了编码值的范围,可以肯定这个数字一定是错误的,这就需要( )。 A: 逻辑一致性清理 B: 系统错误清理 C: 有效范围清理 D: 编码清理
- 关于重复值的描述,说法不正确的是()。 A: 在某些特定情况下,重复值具有一定的使用价值,需做保留 B: 主要是由于人工录入、机械故障导致部分数据重复录入 C: 数据清理过程中一定会将重复值删除 D: 重复值是指样本数据中某个或某些数据记录完全相同
- 数据清理一般需要对缺失值和噪声进行处理。