RDD 表示只读的分区的数据集,对 RDD 进行改动,只能通过 RDD 的转换操作。( )
举一反三
- 关于RDD,下列说法错误的是?() A: RDD具有血统机制(Lineage) B: RDD默认存储在磁盘 C: RDD是一个只读的,可分区的分布式数据集 D: RDD是Spark对基础数据的抽象
- 下列有关RDD的说法中错误的是()。 A: RDD是一个只读的,可分区的分布式数据集。 B: RDD默认存储在磁盘,当磁盘不足时,溢写到内存。 C: RDD数据以分区的形式在集群中存储。 D: RDD具有血统机制,发生数据丢失时,可快速进行数据恢复。
- RDD操作进行的转换指的是() A: 可以通过Scala集合或者Hadoop构造新的RDD B: 通过已有的RDD产生新的RDD C: 通过RDD计算得到一个或一组值 D: 进行countcollect等操作
- 下列关于RDD说法,描述有误的是? A: 一个RDD就是一个分布式对象集合,本质上是一个只读的分区记录集合 B: 每个RDD可分成多个分区,每个分区就是一个数据集片段 C: RDD是可以直接修改的 D: RDD提供了一种高度受限的共享内存模型
- 关于Spark中RDD的描述不准确的是?() A: RDD 可以从 HDFS 输入创建. 或从与 Had oop 兼容的其他存储系统中输入创建 B: Spark 的所有 Transform 操作都是基于 RDD 来实现的。 C: RDD 是只读和可分区的。要想对 RDD 进行操作. 只能重新生成一个新的 RDD。 D: 当前 RDD 默认是存储于内存. 当内存不足时, RDD 也不会溢出到磁盘中