有关RDD描述正确的是( )。
A: 一组分片是数据集的基本组成单位
B: 计算是以分片为单位的
C: RDD的每次转换都会生成一个新的RDD
D: 是一个分区的只读记录的集合
A: 一组分片是数据集的基本组成单位
B: 计算是以分片为单位的
C: RDD的每次转换都会生成一个新的RDD
D: 是一个分区的只读记录的集合
举一反三
- 下列关于RDD说法,描述有误的是? A: 一个RDD就是一个分布式对象集合,本质上是一个只读的分区记录集合 B: 每个RDD可分成多个分区,每个分区就是一个数据集片段 C: RDD是可以直接修改的 D: RDD提供了一种高度受限的共享内存模型
- RDD 表示只读的分区的数据集,对 RDD 进行改动,只能通过 RDD 的转换操作。( )
- 下面关于RDD的描述正确的是:( ) A: 一个RDD就是一个分布式对象集合 B: 一个RDD本质上是一个只读的分区记录集合 C: RDD提供了一组丰富的操作以支持常见的数据运算,分为“行动”(Action)和“转换”(Transformation)两种类型 D: RDD不适合对于数据集中元素执行相同操作的批处理式应用,而比较适合用于需要异步、细粒度状态的应用
- 一个RDD就是一个分布式对象集合,本质上是一个只读的分区记录集合。
- 以下关于spark中的RDD说法正确的是() A: RDD(ResilientDistributedDataset)叫做分布式数据集,是spark中最基本的数据抽象 B: RDD是一个不可变的集合。 C: RDD是可以分成多个分区的,里面的元素可以并行计算的集合。 D: RDD数据本地性,数据向计算靠拢。