在Spark中,关于各种概念之间的相互关系的描述正确的有()
A: 一个应用由一个任务控制点(Driver)和若干个作业(Job)构成。
B: 一个作业由多个阶段(Stage)构成。
C: 一个阶段由多个任务组成。
D: 执行一个应用时,任务控制节点会向集群管理器申请资源,启动Executor,并向Executor发送应用程序代码和文件,然后在Executor执行任务。
E: Executor上的任务执行完成后,执行结果会返回给任务控制节点,或者写入到HDFS或者其他数据库中。
A: 一个应用由一个任务控制点(Driver)和若干个作业(Job)构成。
B: 一个作业由多个阶段(Stage)构成。
C: 一个阶段由多个任务组成。
D: 执行一个应用时,任务控制节点会向集群管理器申请资源,启动Executor,并向Executor发送应用程序代码和文件,然后在Executor执行任务。
E: Executor上的任务执行完成后,执行结果会返回给任务控制节点,或者写入到HDFS或者其他数据库中。
举一反三
- Spark RDD的运行过程主要包括() A: 从磁盘读入数据。 B: 创建RDD对象。 C: SparkContext负责计算RDD之间的依赖关系,构建DAG。 D: DAGScheduler负责把DAG图分解成多个阶段,每个阶段中包含了多个任务,每个任务会被任务任务调度器分发给各个工作节点(Worker Node)上的Executor去执行。
- 与Hadoop MapReduce计算框架相比,Spark所采用的Executor的优点包括() A: Executor利用多线程来执行具体的任务,减少了任务的启动开销,而Hadoop MapReduce采用的是进程模型。 B: Executor利用多进程来执行具体的任务,减少了任务的启动开销,而Hadoop MapReduce采用的是线程模型。 C: Executor中有一个BlockManager存储模块,会将内存和磁盘共同作为存储设备,将最终结果缓存到该存储系统中,可以提高读写IO性能。 D: Executor中有一个BlockManager存储模块,会将内存和磁盘共同作为存储设备,将中间结果缓存到该存储系统中,可以提高读写IO性能。
- 与Hadoop MapReduce计算框架相比,Spark所采用的Executor具有哪些优点? A: 利用多线程来执行具体的任务,减少任务的启动开销 B: Executor中有一个BlockManager存储模块,有效减少IO开销 C: 提供了一种高度受限的共享内存模型 D: 不同场景之间输入输出数据能做到无缝共享
- 1.PLC的“一个工具”、“多个任务”是指什么? A: PLC的操作系统是一个,同一品牌的各个系列PLC模块都借助于这一个操作系统平台,完成各种控制任务。 B: 多个任务的执行,需要为每个任务配备相应的操作工具。 C: 一个完整的PLC系统借助于操作系统这个一个工具可以同时执行多个任务。例如,能同时完成控制、传动、显示和通信任务,满足自动化系统的所有要求。 D: 一个完整的PLC系统借助于操作系统这个一个工具不可以同时执行多个任务。
- MapReduce任务由一个JobTracker和哪个节点控制完成?