在Spark的运行架构中,分布式数据集(RDD)的主要功能是( )。
A: 负责把并行操作发布到集群上
B: 负责跨应用程序分配资源
C: 提供弹性分布式数据的操作
D: 用来执行计算和为应用程序存储数据
A: 负责把并行操作发布到集群上
B: 负责跨应用程序分配资源
C: 提供弹性分布式数据的操作
D: 用来执行计算和为应用程序存储数据
C
举一反三
- spark中的rdd是一个()数据集 A: 弹性分布式 B: 弹性计算 C: 运送数据 D: 心跳
- 关于Spark中的RDD描述正确的( ) A: RDD(Resilient Distributed Datset)叫做弹性分布式数据集,是Spark中最基本的数据抽象。 B: Destributed:分布式,可以并行在集群计算。 C: Resilient:表示弹性的,弹性表示。 D: Datset:就是一个集合,用于存放数据的。
- 下列关于Spark中的RDD描述对的有() A: Dataset:就是一个集合,用于存放数据的 B: Destributed:分布式,可以并行在集群计算 C: RDD(ResilientDistributedDataset)叫做弹性分布式数据集,是spark中最基本的数据抽象 D: Resilient:表示弹性的,弹性表示
- Hadoop提供了一个叫做YARN的分布式资源调度平台,Mapreduce编写好程序后,提交到YARN上运行,由YARN( )。 A: 进行分布式的资源调度 B: 主要负责以分布式的方式存储海量数据 C: 使当前MapReduce程序能够进行分布式运行 D: 实现分布式的海量数据存储
- Spark中Executer() A: 负责运行任务,但是并不为应用程序存储数据。 B: 是集群中一台实际的物理机器,通过配置文件设置指定。 C: 负责大数据计算任务的调度和协调,实际上并不运行任务。 D: 是运行在工作节点上的一个进程,负责运行任务,并为应用程序存储数据。
内容
- 0
spark中弹性分布式数据集指的是哪个() A: RDD B: Driver C: Master D: Map
- 1
关于RDD论述正确的是 ( )。 A: RDD提供一种高度受限的共享内存模型,是一个弹性分布式数据集 B: RDD读取的数据都存储在一台机器上 C: RDD是只读存储 D: RDD 支持各种粗粒度和细粒度的操作
- 2
Spark 将对数据的处理看作对弹性分布式数据集RDD的转换,RDD提供了一种高度受限的共享内存模型
- 3
关于RDD论述正确的是?() A: RDD提供一种高度受限的共享内存模型,是一个弹性分布式数据集 B: RDD<br/>支持各种粗粒度和细粒度的操作 C: RDD是只读存储 D: RDD读取的数据都存储在一台机器上
- 4
分布式GIS是按照系统中的()和针对其中数据处理的分布式计算特征而分类的。 A: 数据应用类别 B: 数据分布特征 C: 数据使用用途 D: 数据运行环境