对于MapReduce编程模型,以下哪个选择不会提高任务的执行效率( )?
A: 使用数据库替换分布式文件系统以提升数据读取速度
B: 引入Combiner减少Map输出数据
C: 合理调配shuffle使用的buffer size使得排序尽可能在内存中进行
D: 合理调配map,reduce数量以便降低调度系统的相对消耗
A: 使用数据库替换分布式文件系统以提升数据读取速度
B: 引入Combiner减少Map输出数据
C: 合理调配shuffle使用的buffer size使得排序尽可能在内存中进行
D: 合理调配map,reduce数量以便降低调度系统的相对消耗
举一反三
- 【多选题】MapReduce执行的全过程包括以下哪几个主要阶段? A. 从分布式文件系统读入数据 B. 执行Map任务输出中间结果 C. 通过 Shuffle阶段把中间结果分区排序整理后发送给Reduce任务 D. 执行Reduce任务得到最终结果并写入分布式文件系统
- Hadoop MapReduce计算的流程是________。 A: Map任务—Shuffle—Reduce任务 B: Map任务—Reduce任务—Shuffle C: Reduce任务—Map任务—Shuffle D: Shuffle—Map任务—Reduce任务
- Reduce端的shuffle会取走map输出的数据,把来自不同map任务的文件归并,再合并
- 对于MapReduce编程模型,以下哪个选择不会提高任务的执行效率( )
- Shuffle连接Map和Reduce两个阶段。 Map Task将数据写到本地磁盘,Reduce Task从每个Map Task上读取一份数据。