MapReduce词频统计案例中,map阶段的数据最终输出成<单词,总个数>这样的格式。( )
错
举一反三
- MapReduce词频统计案例中,map是基于全部数据的并行操作。( )
- MapReduce词频统计案例程序Map阶段输出类型是( ); A: Text B: LongWritable C: IntWritable D: String
- MapReduce词频统计案例中程序Map阶段输入类型是( )。 A: IntWritable B: Text C: LongWritable D: String
- MapReduce词频统计案例中,Map阶段KEYIN输入类型是( )。 A: IntWritable B: LongWritable C: String D: Text
- MapReduce词频统计案例中,Reduce阶段VALUEOUT输出类型是( )。 A: Text B: LongWritable C: Integer D: IntWritable
内容
- 0
MapReduce词频统计案例中,Driver阶段的Configuration会操作job对象实现案例需求。( )
- 1
MapReduce词频统计案例中,reduce是基于全量数据的聚合操作。( )
- 2
MapReduce计算文件词频的例子中描述不正确的是? 包括了Split,Map,Shuffle,Reduce几个过程。在计算过程中数据始终以键值对的形式存在。|Split就是将输入文件中的内容按行分割为key和value的形式。Map阶段对每块的每一个单词为key,单词个数作为value排序进行输出。|在Shuffle阶段,会对map的输出按照key进行合并和排序。|Reduce的过程将所属key下的value进行了叠加,计算出单词key的次数。
- 3
在设计词频统计的MapReduce程序时,对于文本行“hellobigdatahellohadoop”,经过map函数处理后直接输出的结果应该是: A: >、和 B: 、和 C: 、和 D: 、、和
- 4
在MapReduce中,Map数取决于( )的总量 A: 任务数 B: 输入数据 C: 输出数据