distinct算子对源RDD进行去重后返回一个新的RDD
举一反三
- RDD可以从Hadoop兼容的文件系统生成,生成之后可以通过调用RDD的算子对RDD的数据进行部分更新。
- 窄依赖表现为( )。(注意:本题为多选题) A: 一个父RDD对应一个子RDD B: 一个父RDD对应多个子RDD C: 多个父RDD对应一个子RDD D: 多个父RDD对应多个子RDD
- RDD操作进行的转换指的是() A: 可以通过Scala集合或者Hadoop构造新的RDD B: 通过已有的RDD产生新的RDD C: 通过RDD计算得到一个或一组值 D: 进行countcollect等操作
- 能对RDD中的元素进行去重操作的函数是 。
- RDD的操作返回的结果把RDD持久化起来,是一个真正触发执行的过程。