大数据计算服务(MaxCompute,原ODPS)中的MapReduce是一种编程模型,用于大规模数据集的并行运算,它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。其中,两个主要阶段Map和Reduce相互配合,可以完成对海量数据的处理。关于这两个阶段的关系,说法正确的有()
A: 一个reduce的输入数据可能来自于多个map的输出
B: 一个MR处理可以不包括任何map
C: 一个MR处理可以不包括任何reduce
D: 一个map的输出结果可能会被分配到多个reduce上去
A: 一个reduce的输入数据可能来自于多个map的输出
B: 一个MR处理可以不包括任何map
C: 一个MR处理可以不包括任何reduce
D: 一个map的输出结果可能会被分配到多个reduce上去
举一反三
- 关于MapReduce的说法错误的是:()。 A: 是一种编程模型 B: 不适用于大规模数据集(大于1TB)的并行运算 C: 包含“Map(映射)”和“Reduce(归约)” D: 便于编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上
- 在MapReduce编程模式中,Map任务与Reduce任务的数量分别是()? A: 一个Map任务,多个Reduce任务 B: 多个Map任务,多个Reduce任务 C: 一个Map任务,一个Reduce任务 D: 多个Map任务,一个Reduce任务
- Mapreduce将计算过程分为两个阶段,Map阶段并行处理输入数据,Reduce阶段对Map结果进行汇总。
- 本讲提到,MapReduce是一种编程模型,用于大规模数据集的并行运算,它可以分为()几个阶段 A: master B: Map C: Reduce D: worker E: figure
- MapReduce中一个执行Reduce任务的Worker,可能会从多个Map机器上领取数据。()