以下关于rdd的特性说法错误的是()
A: rdd是仅仅由一组partition够成的
B: rdd之间都是独立的,没有依赖
C: 算子作用在partition上
D: 每个rdd都会提供一批最优的计算位置
A: rdd是仅仅由一组partition够成的
B: rdd之间都是独立的,没有依赖
C: 算子作用在partition上
D: 每个rdd都会提供一批最优的计算位置
举一反三
- 以下选项中是persist算子在源码中具有哪些参数的是() A: rdd是由一系列partition够成的 B: rdd之间都是独立的,没有依赖 C: 算子作用在partition上 D: 每个rdd都会提供一批最优的计算位置
- 以下选项属于rdd特性的是() A: 冗余性 B: 一致性 C: rdd之间具有依赖性 D: 每个rdd都会提供一批最优的计算位置
- 窄依赖表现为( )。(注意:本题为多选题) A: 一个父RDD对应一个子RDD B: 一个父RDD对应多个子RDD C: 多个父RDD对应一个子RDD D: 多个父RDD对应多个子RDD
- SparkStreaming容错机制是指RDD中任意的Partition出错,都可以根据其父RDD重新计算生成,如果父RDD丢失,则需要去磁盘中查找原始数据。
- spark Streaming容错机制是指RDD中任意的partition出错,都可以根据其父RDD重新计算生成,如果父RDD丢失,则需要去磁盘中查找原始数据。 A: 正确 B: 错误