原始数据中可能存在的问题包括( )
A: 多个数据源的数据不一致
B: 多个数据源提供重复数据
C: 部分数据不完整
D: 部分数据含有噪声干扰
E: 数据源所提供数据维度高
F: 抽样数据不平衡
A: 多个数据源的数据不一致
B: 多个数据源提供重复数据
C: 部分数据不完整
D: 部分数据含有噪声干扰
E: 数据源所提供数据维度高
F: 抽样数据不平衡
举一反三
- 数据集成是将多个数据源中的数据结合起来存放在一个一致的数据存储(如数据仓库)中。数据源可能涉及多个数据库、数据立方体或一般文件。
- 数据预处理方法不包括( )。 A: 数据清洗:去噪声和无关数据 B: 数据集成:将多个数据源中的数据结合起来存在一个一致的数据存储中 C: 数据变换:把原始数据转换成为适合数据挖掘的形式 D: 数据转化:把连续数据转换为离散数据
- 数据预处理方法不包括( )。 A: 数据清洗:去噪声和无关数据 B: 数据集成:将多个数据源中的数据结合起来存在一个一致的数据存储中十 C: 数据变换:把原始数据转换成为适合数据挖掘的形式中 D: 数据转化:把连续数据转换为离散数据
- 数据清洗即将来自多个数据源的数据组合成一个连贯的数据源。( )
- 数据集成先将数据由多个数据源合并成一个一致的数据,然后进行存储