SparkStreaming容错机制是指RDD中任意的Partition出错，都可以根据其父RDD重新计算生成，如果父RDD丢失，则需要去磁盘中查找原始数据。

2022-06-03

答案：

对

0
关于Spark中RDD的描述不正确的是？（） A: RDD 可以从 HDFS 输入创建.或从与 Hadoop 兼容的其他存储系统中输入创建 B: 当前 RDD 默认是存储于内存.当内存不足时，RDD 也不会溢出到磁盘中。 C: Spark 的所有 Transform 操作都是基于 RDD 来实现的。 D: RDD 是只读和可区分的。要想对 RDD 进行操作.只能重新生成一个新的 RDD
1
关于Spark中RDD的描述不准确的是？（） A: RDD 可以从 HDFS 输入创建. 或从与 Had oop 兼容的其他存储系统中输入创建 B: Spark 的所有 Transform 操作都是基于 RDD 来实现的。 C: RDD 是只读和可分区的。要想对 RDD 进行操作. 只能重新生成一个新的 RDD。 D: 当前 RDD 默认是存储于内存. 当内存不足时， RDD 也不会溢出到磁盘中
2
RDD说法错误的是（） A: 弹性分布式数据集 B: RDD优先使用内存，赋值使用磁盘 C: RDD是Spark的核心 D: RDD本质上就是集合，所以可以理解RDD就是普通集合
3
以下关于rdd的特性说法错误的是（） A: rdd是仅仅由一组partition够成的 B: rdd之间都是独立的，没有依赖 C: 算子作用在partition上 D: 每个rdd都会提供一批最优的计算位置
4
RDD可以从Hadoop兼容的文件系统生成，生成之后可以通过调用RDD的算子对RDD的数据进行部分更新。