下面哪个是RDD的特点()
A: 可分区
B: 可序列化
C: 可修改
D: 可持久化
A: 可分区
B: 可序列化
C: 可修改
D: 可持久化
举一反三
- Spark采用RDD以后能实现高效计算的原因有() A: 中间结果存入磁盘 B: 中间结果可持久化到内存 C: 高效的容错性 D: 采用分区可实现计算向数据靠拢
- Spark采用RDD以后能够实现高效计算的原因主要在于? A: 高效的容错性 B: 中间结果持久化到内存,数据在内存中的多个 C: 存放的数据可以是Java对象,避免了不必要的对象序列化和反序列化 D: 采用数据复制实现容错
- 下列关于RDD说法,描述有误的是? A: 一个RDD就是一个分布式对象集合,本质上是一个只读的分区记录集合 B: 每个RDD可分成多个分区,每个分区就是一个数据集片段 C: RDD是可以直接修改的 D: RDD提供了一种高度受限的共享内存模型
- 下列哪些属于RDD的特性 A: Spark的运行效率高于MapReduce B: JAVA对象存内存,避免了序列化和反序列化开销 C: 中间结果持久化到内存,避免了磁盘开销 D: 高效的容错性
- 下列有关RDD的说法中错误的是()。 A: RDD是一个只读的,可分区的分布式数据集。 B: RDD默认存储在磁盘,当磁盘不足时,溢写到内存。 C: RDD数据以分区的形式在集群中存储。 D: RDD具有血统机制,发生数据丢失时,可快速进行数据恢复。