RDD 中可以对创建好的RDD 进行编辑改动。( )
错
举一反三
- RDD 表示只读的分区的数据集,对 RDD 进行改动,只能通过 RDD 的转换操作。( )
- 关于Spark中RDD的描述不正确的是?() A: RDD 可以从 HDFS 输入创建.或从与 Hadoop 兼容的其他存储系统中输入创建 B: 当前 RDD 默认是存储于内存.当内存不足时,RDD 也不会溢出到磁盘中。 C: Spark 的所有 Transform 操作都是基于 RDD 来实现的。 D: RDD 是只读和可区分的。要想对 RDD 进行操作.只能重新生成一个新的 RDD
- 关于Spark中RDD的描述不准确的是?() A: RDD 可以从 HDFS 输入创建. 或从与 Had oop 兼容的其他存储系统中输入创建 B: Spark 的所有 Transform 操作都是基于 RDD 来实现的。 C: RDD 是只读和可分区的。要想对 RDD 进行操作. 只能重新生成一个新的 RDD。 D: 当前 RDD 默认是存储于内存. 当内存不足时, RDD 也不会溢出到磁盘中
- 以下哪个不是RDD的创建方式?() A: 从子的RDD转换到新的RDD B: 从数据集合转换而来 C: 从HDFS输入创建 D: 从父的RDD转换的到新的RDD
- RDD可以从Hadoop兼容的文件系统生成,生成之后可以通过调用RDD的算子对RDD的数据进行部分更新。
内容
- 0
RDD操作进行的转换指的是() A: 可以通过Scala集合或者Hadoop构造新的RDD B: 通过已有的RDD产生新的RDD C: 通过RDD计算得到一个或一组值 D: 进行countcollect等操作
- 1
下列哪一种方法可以得到RDD(('a',1))()。 A: RDD(('a',1),('b',1)) union RDD(('a',1),('b',1)) B: RDD(('a',1),('b',1)) join RDD(('a',1),('b',1)) C: RDD(('a',1),('b',1)) intersection RDD(('a',1),('d',1)) D: RDD(('a',1),('b',1)) subtract RDD(('a',1),('b',1))
- 2
窄依赖表现为( )。(注意:本题为多选题) A: 一个父RDD对应一个子RDD B: 一个父RDD对应多个子RDD C: 多个父RDD对应一个子RDD D: 多个父RDD对应多个子RDD
- 3
RDD说法错误的是() A: 弹性分布式数据集 B: RDD优先使用内存,赋值使用磁盘 C: RDD是Spark的核心 D: RDD本质上就是集合,所以可以理解RDD就是普通集合
- 4
distinct算子对源RDD进行去重后返回一个新的RDD