数据预处理负责将分散的、异构数据源中的数据如关系数据、网络数据、日志数据、文件数据等抽取到临时中间层,然后进行清洗、转换、集成,最后加载到数据仓库或数据库中,成为通过数据分析、数据挖掘等方式提供决策支持的数据。数据预处理能够帮助改善数据的质量进而帮助提高数据挖掘进程的有效性和准确性,因此数据预处理是整个数据挖掘与知识发现过程中的一个重要步骤。 数据预处理主要包括数据清洗(DataCleaning)、数据集成(DataIntegration)、数据转换(Data Transformation)和数据消减(DataReduction)。 请大家利用网络搜索引擎,探索数据预处理的主要技术,并完成下表的填写。 序号 数据预处理形式 主要关键技术 1 数据精理 (1) 2 数据集成 (2) 3 数据归约 (3) 4 数据转换 (4)
举一反三
- 数据预处理的过程: 数据清洗、数据统计、数据挖掘、数据归约|数据清洗、数据集成、数据转换、数据归约|数据统计、数据清洗、数据挖掘、数据归约|数据采集、数据清洗、数据挖掘、数据统计
- 数据预处理的过程( ) A: 数据清洗、数据集成、数据转换、数据归约 B: 数据清洗、数据统计、数据挖掘、数据归约 C: 数据采集、数据清洗、数据挖掘、数据统计 D: 数据统计、数据清洗、数据挖掘、数据归约
- 常用的数据预处理技术包括数据清洗,数据集成,数据转换和数据归约。
- 大数据的预处理过程包括数据清洗、数据转换、数据集成和()。 A: 数据存储 B: 数据挖掘 C: 数据规约 D: 数据分析
- KDD的五个基本步骤是(). A: 数据选择、数据预处理、数据转换、数据挖掘、解释和评估 B: 数据选择、数据转换、数据预处理、数据挖掘、解释和评估 C: 数据选择、数据存储、数据预处理、数据挖掘、解释和评估 D: 数据获取、数据存储、数据预处理、数据转换、数据挖掘