• 2022-07-24
    MapReduce词频统计案例中,map阶段的数据最终输出成<单词,总个数>这样的格式。( )
  • 内容

    • 0

      MapReduce词频统计案例中,Driver阶段的Configuration会操作job对象实现案例需求。( )

    • 1

      MapReduce词频统计案例中,reduce是基于全量数据的聚合操作。( )

    • 2

      MapReduce计算文件词频的例子中描述不正确的是? 包括了Split,Map,Shuffle,Reduce几个过程。在计算过程中数据始终以键值对的形式存在。|Split就是将输入文件中的内容按行分割为key和value的形式。Map阶段对每块的每一个单词为key,单词个数作为value排序进行输出。|在Shuffle阶段,会对map的输出按照key进行合并和排序。|Reduce的过程将所属key下的value进行了叠加,计算出单词key的次数。

    • 3

      在设计词频统计的MapReduce程序时,对于文本行“hellobigdatahellohadoop”,经过map函数处理后直接输出的结果应该是: A: >、和 B: 、和 C: 、和 D: 、、和

    • 4

      在MapReduce中,Map数取决于( )的总量 A: 任务数 B: 输入数据 C: 输出数据