• 2021-04-14
    中国大学MOOC: MapReduce采用 策略,一个存储在分布式文件系统中的大规模数据集,会被切分成许多独立的分片,这些分片可以被多个Map任务并行处理。
  • 分而治之

    举一反三

    内容

    • 0

      以下关于MapReduce执行过程的描述正确的有()。 A: Map任务的输入文件是保存在分布式文件系统中的。 B: Reduce任务的处理结果是保存在分布式文件系统中的。 C: Map任务处理得到的中间结果保存在本地存储中。 D: Map任务处理得到的中间结果保存在分布式文件系统中。

    • 1

      关于 MapReduce的描述错误的是() A: MapReduce框架会先排序 map任务的输出 B: 通常,作业的输入输出都会被存储在文件系统中 C: 通常计算节点和存储节点是同一节点 D: 一个 Task 通常会把输入集切分成若干独立的数据块

    • 2

      MapReduce的处理流程包含分片、Map阶段、 、Reduce阶段。

    • 3

      MapReduce中的Map阶段,系统将数据拆分为若干个“分片”(split)。 A: 正确 B: 错误

    • 4

      大数据计算服务(MaxCompute,原ODPS)中的MapReduce是一种编程模型,用于大规模数据集的并行运算,它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。其中,两个主要阶段Map和Reduce相互配合,可以完成对海量数据的处理。关于这两个阶段的关系,说法正确的有() A: 一个reduce的输入数据可能来自于多个map的输出 B: 一个MR处理可以不包括任何map C: 一个MR处理可以不包括任何reduce D: 一个map的输出结果可能会被分配到多个reduce上去