下列哪一种方法可以得到RDD(('a',1))()。
A: RDD(('a',1),('b',1)) union RDD(('a',1),('b',1))
B: RDD(('a',1),('b',1)) join RDD(('a',1),('b',1))
C: RDD(('a',1),('b',1)) intersection RDD(('a',1),('d',1))
D: RDD(('a',1),('b',1)) subtract RDD(('a',1),('b',1))
A: RDD(('a',1),('b',1)) union RDD(('a',1),('b',1))
B: RDD(('a',1),('b',1)) join RDD(('a',1),('b',1))
C: RDD(('a',1),('b',1)) intersection RDD(('a',1),('d',1))
D: RDD(('a',1),('b',1)) subtract RDD(('a',1),('b',1))
举一反三
- 窄依赖表现为( )。(注意:本题为多选题) A: 一个父RDD对应一个子RDD B: 一个父RDD对应多个子RDD C: 多个父RDD对应一个子RDD D: 多个父RDD对应多个子RDD
- 从RDD转换得到DataFrame包含两种典型方法,分别是: A: 利用反射机制推断RDD模式 B: 使用编程方式定义RDD模式 C: 利用投影机制推断RDD模式 D: 利用互联机制推断RDD模式
- RDD说法错误的是() A: 弹性分布式数据集 B: RDD优先使用内存,赋值使用磁盘 C: RDD是Spark的核心 D: RDD本质上就是集合,所以可以理解RDD就是普通集合
- RDD操作进行的转换指的是() A: 可以通过Scala集合或者Hadoop构造新的RDD B: 通过已有的RDD产生新的RDD C: 通过RDD计算得到一个或一组值 D: 进行countcollect等操作
- 下列关于弹性分布式数据集(RDD)的表述不正确的是 A: RDD是一个数据库 B: RDD是一个分布式的数据结构 C: RDD是一个数据抽象类型 D: RDD是一个编程范式