在Spark的运行架构中,分布式数据集(RDD)的主要功能是( )。
A: 负责把并行操作发布到集群上
B: 负责跨应用程序分配资源
C: 提供弹性分布式数据的操作
D: 用来执行计算和为应用程序存储数据
A: 负责把并行操作发布到集群上
B: 负责跨应用程序分配资源
C: 提供弹性分布式数据的操作
D: 用来执行计算和为应用程序存储数据
举一反三
- spark中的rdd是一个()数据集 A: 弹性分布式 B: 弹性计算 C: 运送数据 D: 心跳
- 关于Spark中的RDD描述正确的( ) A: RDD(Resilient Distributed Datset)叫做弹性分布式数据集,是Spark中最基本的数据抽象。 B: Destributed:分布式,可以并行在集群计算。 C: Resilient:表示弹性的,弹性表示。 D: Datset:就是一个集合,用于存放数据的。
- 下列关于Spark中的RDD描述对的有() A: Dataset:就是一个集合,用于存放数据的 B: Destributed:分布式,可以并行在集群计算 C: RDD(ResilientDistributedDataset)叫做弹性分布式数据集,是spark中最基本的数据抽象 D: Resilient:表示弹性的,弹性表示
- Hadoop提供了一个叫做YARN的分布式资源调度平台,Mapreduce编写好程序后,提交到YARN上运行,由YARN( )。 A: 进行分布式的资源调度 B: 主要负责以分布式的方式存储海量数据 C: 使当前MapReduce程序能够进行分布式运行 D: 实现分布式的海量数据存储
- Spark中Executer() A: 负责运行任务,但是并不为应用程序存储数据。 B: 是集群中一台实际的物理机器,通过配置文件设置指定。 C: 负责大数据计算任务的调度和协调,实际上并不运行任务。 D: 是运行在工作节点上的一个进程,负责运行任务,并为应用程序存储数据。