以下关于MapReduce执行过程的描述正确的有()。
A: Map任务的输入文件是保存在分布式文件系统中的。
B: Reduce任务的处理结果是保存在分布式文件系统中的。
C: Map任务处理得到的中间结果保存在本地存储中。
D: Map任务处理得到的中间结果保存在分布式文件系统中。
A: Map任务的输入文件是保存在分布式文件系统中的。
B: Reduce任务的处理结果是保存在分布式文件系统中的。
C: Map任务处理得到的中间结果保存在本地存储中。
D: Map任务处理得到的中间结果保存在分布式文件系统中。
举一反三
- 以下关于MapReduce执行过程的描述,正确的是()。 A: MapReduce执行过程中,Map任务输入文件保存在分布式文件系统中。 B: MapReduce执行过程中,Map任务处理得到的中间结果保存在本地存储中。 C: MapReduce执行过程中,Reduce任务处理结果都保存在本地存储中。 D: MapReduce执行过程中,只有当Map处理全部结束后,Reduce过程才能开始。
- 【多选题】MapReduce执行的全过程包括以下哪几个主要阶段? A. 从分布式文件系统读入数据 B. 执行Map任务输出中间结果 C. 通过 Shuffle阶段把中间结果分区排序整理后发送给Reduce任务 D. 执行Reduce任务得到最终结果并写入分布式文件系统
- 下列关于Map/Reduce计算流程叙述不正确的一项为: A: Mapper读取分派给它的输出Split,并生成相应的本地缓存。 B: Mapper执行计算处理任务,将中间结果输出保存在本地缓存。 C: Application Master调度Reducer读取Mapper的中间输出文件,执行Reduce任务。 D: Reducer将最后结果写入输出文件保存到HDFS。
- 下列关于分布式文件系统说法错误的是( )。 A: 又称集群文件系统 B: 分布式文件系统中的文件存储在一个分布式系统中的多个节点中 C: 分布式件系统就是分布式存储系统 D: HDFS和GFS是典型的分布式文件系统
- MapReduce采用“分而治之”策略,一个存储在分布式文件系统中的大规模数据集,会被切分成许多独立的分片,这些分片可以被多个Map任务并行处理