Spark RDD提供了一组丰富的操作以支持常见的数据运算,“转换”(Transformation)()
A: 包括诸如count、collect等操作。
B: 可以触发真正的计算,这是惰性调用导致的。
C: 执行计算并指定输出的形式。
D: 指定RDD之间的相互依赖关系,即接受RDD并返回RDD。
A: 包括诸如count、collect等操作。
B: 可以触发真正的计算,这是惰性调用导致的。
C: 执行计算并指定输出的形式。
D: 指定RDD之间的相互依赖关系,即接受RDD并返回RDD。
举一反三
- Spark RDD提供了一组丰富的操作以支持常见的数据运算,“行动”(Action)() A: 接受RDD并返回RDD,指定了RDD之间的相互依赖关系。 B: 接受RDD但是返回非RDD(即输出一个值或结果),执行计算并指定输出的形式。 C: 并不会触发真正的计算操作,这是因为RDD采用了惰性调用机制。 D: 包括诸如map、filter、groupby、join等。
- Spark RDD采用了惰性调用,在RDD的执行过程中,真正的计算发生在RDD的“行动”操作,对于“行动”操作之前的所有“转换”操作,仅记录下操作应用的一些基础数据集以及RDD生成的轨迹,并不会出发真正的操作。
- Spark的RDD的转换会触发Spark计算操作。
- (判断)Spark的RDD的转换不会触发Spark计算操作。() A: Ture B: False
- 下面关于RDD的描述正确的是:( ) A: 一个RDD就是一个分布式对象集合 B: 一个RDD本质上是一个只读的分区记录集合 C: RDD提供了一组丰富的操作以支持常见的数据运算,分为“行动”(Action)和“转换”(Transformation)两种类型 D: RDD不适合对于数据集中元素执行相同操作的批处理式应用,而比较适合用于需要异步、细粒度状态的应用