SparkStreaming容错机制是指RDD中任意的Partition出错,都可以根据其父RDD重新计算生成,如果父RDD丢失,则需要去磁盘中查找原始数据。
举一反三
- spark Streaming容错机制是指RDD中任意的partition出错,都可以根据其父RDD重新计算生成,如果父RDD丢失,则需要去磁盘中查找原始数据。 A: 正确 B: 错误
- 如果一个RDD在计算过程中出错,可以直接通过它的父RDD重新计算得到,这是Spark基于 的容错机制。
- 窄依赖表现为( )。(注意:本题为多选题) A: 一个父RDD对应一个子RDD B: 一个父RDD对应多个子RDD C: 多个父RDD对应一个子RDD D: 多个父RDD对应多个子RDD
- 关于RDD,下列说法错误的是?() A: RDD具有血统机制(Lineage) B: RDD默认存储在磁盘 C: RDD是一个只读的,可分区的分布式数据集 D: RDD是Spark对基础数据的抽象
- 下列有关RDD的说法中错误的是()。 A: RDD是一个只读的,可分区的分布式数据集。 B: RDD默认存储在磁盘,当磁盘不足时,溢写到内存。 C: RDD数据以分区的形式在集群中存储。 D: RDD具有血统机制,发生数据丢失时,可快速进行数据恢复。