• 2022-11-04
    "描述下Shuffle过程中分区?
  • MapReduce提供Partitioner接口,它的作用就是根据key或value及reduce的数量来决定当前的这对输出的最终应该交由哪个reduce task处理。默认情况下:mapreduce使用的系统提供的Partitioner:HashPartitoner.class。默认对key hash后再以reduce task数量取模。"

    内容

    • 0

      ‍逻辑分区是从主分区中分割出来的。‏

    • 1

      Map端的Shuffle过程

    • 2

      43、MapReduce的Shuffle过程以下中哪个操作是最后做的?()。 A: A、排序 B: B、合并 C: C、分区 D: D、溢写

    • 3

      Shuffle过程一般包括、、、四个步骤。

    • 4

      Reduce端的Shuffle过程包括() A: “领取”数据 B: 溢写(分区、排序和合并) C: 把数据输入给Reduce任务 D: 归并数据