将不同数据源中的数据进行数据集成时,常常遇到以下哪些问题。
A: 数据类型不一致
B: 字段同名异义
C: 字段异名同义
D: 数值不一致
E: 大量重复数据
F: 非结构化数据
A: 数据类型不一致
B: 字段同名异义
C: 字段异名同义
D: 数值不一致
E: 大量重复数据
F: 非结构化数据
A,B,C,D
举一反三
- 将不同数据源中的数据进行数据集成时,常常遇到以下哪些问题。 A: 数据类型不一致 B: 字段同名异义 C: 字段异名同义 D: 数值不一致
- 将不同数据源中的数据进行数据集成时,常常遇到以下哪些问题
- 原始数据中可能存在的问题包括( ) A: 多个数据源的数据不一致 B: 多个数据源提供重复数据 C: 部分数据不完整 D: 部分数据含有噪声干扰 E: 数据源所提供数据维度高 F: 抽样数据不平衡
- 脏指数据可能存在以下哪些问题?( ) A: 数据缺失 B: 数据噪声 C: 数据不一致 D: 数据重复
- 以下哪类数据不属于需要进行清洗的数据类型? A: 数值数据 B: 残缺数据 C: 错误数据 D: 格式不一致数据
内容
- 0
数据集成先将数据由多个数据源合并成一个一致的数据,然后进行存储
- 1
以下说法正确的是( )。(1.0) A: 有信息不一定有数据 B: 信息是数据的不同的存在形式 C: 有数据一定有信息 D: 有信息一定有数据 E: 有数据不一定有信息
- 2
下面关于数据集成,说法错误的是( ) A: 实体识别问题可以使用数据库或数据仓库中的元数据来进行实体识别。 B: 在数据集成中,不需要考虑数据的度量单位不一致问题。 C: 在数据集成中,要考虑数据冗余问题。 D: 数据集成问题,也就是把多个数据源中的数据(集成到同一个数据源中,以便为后续数据分析工作的顺利完成提供完整的数据基础。
- 3
脏数据的表现形式有哪些?() A: 缺失数据 B: 重复数据 C: 不一致数据 D: 不可用数据
- 4
在电子数据审计中,对于被审计单位的源数据存在类型不一致、格式不一致的情况,审计人员应该进行()。 A: 数据采集 B: 数据清理 C: 数据转换 D: 数据验证