Spark的任务调度执行机制是以什么为基础的( )。
A: 内存计算
B: 数据流
C: RDD
D: DAG
A: 内存计算
B: 数据流
C: RDD
D: DAG
举一反三
- Spark使用基于_______的任务调度执行机制。 A: RDG B: DAG C: GCC D: RDD
- Spark使用先进的DAG执行引擎,以支持循环数据流与内存计算。
- 与Hadoop对比,Spark的优点包括() A: Spark的计算结果放在内存中,节省了磁盘存储空间。 B: Spark的计算模式也属于MapReduce,但编程模型比MapReduce更灵活。 C: Spark提供了内存计算,中间结果放到内存中,提高了迭代运算效率。 D: Spark基于DAG的任务调度执行机制,性能优于MapReduce的迭代执行机制。
- 以下关于MapReduce和Spark的说法,错误的是( )。 A: Spark中没有map和reduce操作。 B: MapReduce不适合迭代计算。 C: Spark提供了内存计算,可将中间结果放到内存中,对于迭代运算效率更高。 D: Spark基于DAG的任务调度执行机制,要优于Hadoop MapReduce的迭代执行机制。
- Spark RDD的运行过程主要包括() A: 从磁盘读入数据。 B: 创建RDD对象。 C: SparkContext负责计算RDD之间的依赖关系,构建DAG。 D: DAGScheduler负责把DAG图分解成多个阶段,每个阶段中包含了多个任务,每个任务会被任务任务调度器分发给各个工作节点(Worker Node)上的Executor去执行。