以下关于spark中的RDD说法正确的是()
A: RDD(ResilientDistributedDataset)叫做分布式数据集,是spark中最基本的数据抽象
B: RDD是一个不可变的集合。
C: RDD是可以分成多个分区的,里面的元素可以并行计算的集合。
D: RDD数据本地性,数据向计算靠拢。
A: RDD(ResilientDistributedDataset)叫做分布式数据集,是spark中最基本的数据抽象
B: RDD是一个不可变的集合。
C: RDD是可以分成多个分区的,里面的元素可以并行计算的集合。
D: RDD数据本地性,数据向计算靠拢。
举一反三
- 下列关于Spark中的RDD描述对的有() A: Dataset:就是一个集合,用于存放数据的 B: Destributed:分布式,可以并行在集群计算 C: RDD(ResilientDistributedDataset)叫做弹性分布式数据集,是spark中最基本的数据抽象 D: Resilient:表示弹性的,弹性表示
- RDD说法错误的是() A: 弹性分布式数据集 B: RDD优先使用内存,赋值使用磁盘 C: RDD是Spark的核心 D: RDD本质上就是集合,所以可以理解RDD就是普通集合
- 关于Spark中的RDD描述正确的( ) A: RDD(Resilient Distributed Datset)叫做弹性分布式数据集,是Spark中最基本的数据抽象。 B: Destributed:分布式,可以并行在集群计算。 C: Resilient:表示弹性的,弹性表示。 D: Datset:就是一个集合,用于存放数据的。
- 关于RDD,下列说法错误的是?() A: RDD具有血统机制(Lineage) B: RDD默认存储在磁盘 C: RDD是一个只读的,可分区的分布式数据集 D: RDD是Spark对基础数据的抽象
- 下列关于RDD说法,描述有误的是? A: 一个RDD就是一个分布式对象集合,本质上是一个只读的分区记录集合 B: 每个RDD可分成多个分区,每个分区就是一个数据集片段 C: RDD是可以直接修改的 D: RDD提供了一种高度受限的共享内存模型