"描述下Shuffle过程中分区?
MapReduce提供Partitioner接口,它的作用就是根据key或value及reduce的数量来决定当前的这对输出的最终应该交由哪个reduce task处理。默认情况下:mapreduce使用的系统提供的Partitioner:HashPartitoner.class。默认对key hash后再以reduce task数量取模。"
举一反三
内容
- 0
逻辑分区是从主分区中分割出来的。
- 1
Map端的Shuffle过程
- 2
43、MapReduce的Shuffle过程以下中哪个操作是最后做的?()。 A: A、排序 B: B、合并 C: C、分区 D: D、溢写
- 3
Shuffle过程一般包括、、、四个步骤。
- 4
Reduce端的Shuffle过程包括() A: “领取”数据 B: 溢写(分区、排序和合并) C: 把数据输入给Reduce任务 D: 归并数据