SparkStreaming容错机制是指RDD中任意的Partition出错,都可以根据其父RDD重新计算生成,如果父RDD丢失,则需要去磁盘中查找原始数据。
对
本题目来自[网课答案]本页地址:https://www.wkda.cn/ask/yzjytojazeoajzo.html
举一反三
- spark Streaming容错机制是指RDD中任意的partition出错,都可以根据其父RDD重新计算生成,如果父RDD丢失,则需要去磁盘中查找原始数据。 A: 正确 B: 错误
- 如果一个RDD在计算过程中出错,可以直接通过它的父RDD重新计算得到,这是Spark基于 的容错机制。
- 窄依赖表现为( )。(注意:本题为多选题) A: 一个父RDD对应一个子RDD B: 一个父RDD对应多个子RDD C: 多个父RDD对应一个子RDD D: 多个父RDD对应多个子RDD
- 关于RDD,下列说法错误的是?() A: RDD具有血统机制(Lineage) B: RDD默认存储在磁盘 C: RDD是一个只读的,可分区的分布式数据集 D: RDD是Spark对基础数据的抽象
- 下列有关RDD的说法中错误的是()。 A: RDD是一个只读的,可分区的分布式数据集。 B: RDD默认存储在磁盘,当磁盘不足时,溢写到内存。 C: RDD数据以分区的形式在集群中存储。 D: RDD具有血统机制,发生数据丢失时,可快速进行数据恢复。
内容
- 0
关于Spark中RDD的描述不正确的是?() A: RDD 可以从 HDFS 输入创建.或从与 Hadoop 兼容的其他存储系统中输入创建 B: 当前 RDD 默认是存储于内存.当内存不足时,RDD 也不会溢出到磁盘中。 C: Spark 的所有 Transform 操作都是基于 RDD 来实现的。 D: RDD 是只读和可区分的。要想对 RDD 进行操作.只能重新生成一个新的 RDD
- 1
关于Spark中RDD的描述不准确的是?() A: RDD 可以从 HDFS 输入创建. 或从与 Had oop 兼容的其他存储系统中输入创建 B: Spark 的所有 Transform 操作都是基于 RDD 来实现的。 C: RDD 是只读和可分区的。要想对 RDD 进行操作. 只能重新生成一个新的 RDD。 D: 当前 RDD 默认是存储于内存. 当内存不足时, RDD 也不会溢出到磁盘中
- 2
RDD说法错误的是() A: 弹性分布式数据集 B: RDD优先使用内存,赋值使用磁盘 C: RDD是Spark的核心 D: RDD本质上就是集合,所以可以理解RDD就是普通集合
- 3
以下关于rdd的特性说法错误的是() A: rdd是仅仅由一组partition够成的 B: rdd之间都是独立的,没有依赖 C: 算子作用在partition上 D: 每个rdd都会提供一批最优的计算位置
- 4
RDD可以从Hadoop兼容的文件系统生成,生成之后可以通过调用RDD的算子对RDD的数据进行部分更新。