下列关于spark中的RDD描述正确的有
举一反三
- spark中的RDD有哪些特性?
- spark中的RDD是什么?
- 下列关于Spark中的RDD描述对的有() A: Dataset:就是一个集合,用于存放数据的 B: Destributed:分布式,可以并行在集群计算 C: RDD(ResilientDistributedDataset)叫做弹性分布式数据集,是spark中最基本的数据抽象 D: Resilient:表示弹性的,弹性表示
- 以下关于spark中的RDD说法正确的是() A: RDD(ResilientDistributedDataset)叫做分布式数据集,是spark中最基本的数据抽象 B: RDD是一个不可变的集合。 C: RDD是可以分成多个分区的,里面的元素可以并行计算的集合。 D: RDD数据本地性,数据向计算靠拢。
- 关于Spark中RDD的描述不正确的是?() A: RDD 可以从 HDFS 输入创建.或从与 Hadoop 兼容的其他存储系统中输入创建 B: 当前 RDD 默认是存储于内存.当内存不足时,RDD 也不会溢出到磁盘中。 C: Spark 的所有 Transform 操作都是基于 RDD 来实现的。 D: RDD 是只读和可区分的。要想对 RDD 进行操作.只能重新生成一个新的 RDD