• 2022-05-27
    Shuffle连接Map和Reduce两个阶段。 Map Task将数据写到本地磁盘,Reduce Task从每个Map Task上读取一份数据。
  • 内容

    • 0

      关于MapReduce1.0的体系结构的描述,下列说法错误的是? A: Task 分为Map Task 和Reduce Task 两种,分别由JobTracker 和TaskTracker 启动 B: slot 分为Map slot 和Reduce slot 两种,分别供MapTask 和Reduce Task 使用 C: TaskTracker 使用“slot”等量划分本节点上的资源量(CPU、内存等) D: TaskTracker 会周期性接收JobTracker 发送过来的命令并执行相应的操作(如启动新任务、杀死任务等)

    • 1

      Map和Reduce之间通过Shuffle进行通信。

    • 2

      Mapreduce将计算过程分为两个阶段,Map阶段并行处理输入数据,Reduce阶段对Map结果进行汇总。

    • 3

      Reduce端的shuffle会取走map输出的数据,把来自不同map任务的文件归并,再合并

    • 4

      从MapReduce自身的命名特点可以看出,MapReduce由两个阶段组成:Map和Reduce。所有MapReduce程序都必须有Map和Reduce两个阶段