RDD作为Spark最核心的对象,具有一下那些特点?()
A: 只读
B: 分区
C: 容错
D: 高效
A: 只读
B: 分区
C: 容错
D: 高效
举一反三
- 关于RDD,下列说法错误的是?() A: RDD具有血统机制(Lineage) B: RDD默认存储在磁盘 C: RDD是一个只读的,可分区的分布式数据集 D: RDD是Spark对基础数据的抽象
- Spark采用RDD以后能实现高效计算的原因有() A: 中间结果存入磁盘 B: 中间结果可持久化到内存 C: 高效的容错性 D: 采用分区可实现计算向数据靠拢
- Spark采用RDD以后能够实现高效计算的原因主要在于? A: 高效的容错性 B: 中间结果持久化到内存,数据在内存中的多个 C: 存放的数据可以是Java对象,避免了不必要的对象序列化和反序列化 D: 采用数据复制实现容错
- Spark引入了一个称为()的概念,它是不可变的、容错的、分布式对象集合 A: RDD B: SparkStreaming C: SparkSQL D: Shark
- 一个RDD就是一个分布式对象集合,本质上是一个只读的分区记录集合。