如果对一系列数据进行排序,可以把这些数据作为map阶段的输出键,在Reduce中定义如何排序。
举一反三
- 在Shuffle阶段,可以根据业务需要直接对Map结果排序,或将排序放在Reduce阶段完成
- Reduce阶段就是对多个map任务的输出进行(____)。 A: 规约 B: 排序 C: 存储 D: 筛选
- MapReduce框架中,在Map和Reduce之间的combiner的作用是( ) A: 对中间格式进行压缩 B: 对中间结果进行混洗 C: 对Map的输出结果排序 D: 将中间结果中同一个key的数据合并
- MapReduce计算文件词频的例子中描述不正确的是? 包括了Split,Map,Shuffle,Reduce几个过程。在计算过程中数据始终以键值对的形式存在。|Split就是将输入文件中的内容按行分割为key和value的形式。Map阶段对每块的每一个单词为key,单词个数作为value排序进行输出。|在Shuffle阶段,会对map的输出按照key进行合并和排序。|Reduce的过程将所属key下的value进行了叠加,计算出单词key的次数。
- Excel2010中,对数据表进行排序时可以使用一列数据作为一个关键字段进行排序,也可以使用多列数据作为关键字段进行排序