Spark RDD提供了一组丰富的操作以支持常见的数据运算,“行动”(Action)()
A: 接受RDD并返回RDD,指定了RDD之间的相互依赖关系。
B: 接受RDD但是返回非RDD(即输出一个值或结果),执行计算并指定输出的形式。
C: 并不会触发真正的计算操作,这是因为RDD采用了惰性调用机制。
D: 包括诸如map、filter、groupby、join等。
A: 接受RDD并返回RDD,指定了RDD之间的相互依赖关系。
B: 接受RDD但是返回非RDD(即输出一个值或结果),执行计算并指定输出的形式。
C: 并不会触发真正的计算操作,这是因为RDD采用了惰性调用机制。
D: 包括诸如map、filter、groupby、join等。
举一反三
- Spark RDD提供了一组丰富的操作以支持常见的数据运算,“转换”(Transformation)() A: 包括诸如count、collect等操作。 B: 可以触发真正的计算,这是惰性调用导致的。 C: 执行计算并指定输出的形式。 D: 指定RDD之间的相互依赖关系,即接受RDD并返回RDD。
- Spark RDD采用了惰性调用,在RDD的执行过程中,真正的计算发生在RDD的“行动”操作,对于“行动”操作之前的所有“转换”操作,仅记录下操作应用的一些基础数据集以及RDD生成的轨迹,并不会出发真正的操作。
- RDD的操作返回的结果把RDD持久化起来,是一个真正触发执行的过程。
- RDD的( )操作返回的结果把RDD持久化起来,是一个真正触发执行的过程。 A: Transformation B: 迭代 C: Action D: 查找
- RDD操作进行的转换指的是() A: 可以通过Scala集合或者Hadoop构造新的RDD B: 通过已有的RDD产生新的RDD C: 通过RDD计算得到一个或一组值 D: 进行countcollect等操作