Spark引入了一个称为( )的概念,它是不可变的、容错的、分布式对象集合。
举一反三
- Spark引入了一个称为()的概念,它是不可变的、容错的、分布式对象集合 A: RDD B: SparkStreaming C: SparkSQL D: Shark
- 一个RDD就是一个分布式对象集合,本质上是一个只读的分区记录集合。
- 一个RDD就是一个分布式对象集合,本质上是一个只读的分区记录集合。 A: 正确 B: 错误
- 以下关于spark中的RDD说法正确的是() A: RDD(ResilientDistributedDataset)叫做分布式数据集,是spark中最基本的数据抽象 B: RDD是一个不可变的集合。 C: RDD是可以分成多个分区的,里面的元素可以并行计算的集合。 D: RDD数据本地性,数据向计算靠拢。
- ( )是一个分布式机器学习库,即在Spark平台上对一些常用的机器学习算法进行了分布式实现。 A: Data Manager B: MLlib C: Spark Runtime D: Spark SQL