下列对spark描述正确的有?
A: spark是基于内存计算的
B: spark由AMPlab实验室开发
C: spark处理大量数据的一个快速通用的引擎
D: spark目前是apache的顶级项目
A: spark是基于内存计算的
B: spark由AMPlab实验室开发
C: spark处理大量数据的一个快速通用的引擎
D: spark目前是apache的顶级项目
举一反三
- 由于Spark是基于内存的计算引擎,因此,一个Spark应用可以处理的数据量不能超过分给这个Spark应用的内存总和。()
- Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎,在下面的Spark库中,哪一个是用于机器学习的( )。 A: Spark SQL B: MLlib C: GraphX D: Spark Streaming
- 关于Spark描述错误的是 A: Spark SQL是Spark提供的对实时数据进行流式计算的组件 B: Spark是一个用来实现快速而通用的集群计算的平台 C: Spark适用于各种各样的分布式平台场景,包括批处理、迭代算法、交互式查询、流处理等 D: Spark core实现Spark的基本功能
- 关于Spark的说法正确的是 A: Spark是基于内存的实时数据分析框架 B: Spark是基于内存计算的大数据并行计算框架 C: Spark用206个节点对100TB数据做基准排序需23分 D: Spark可用于构建大型的、低延迟的数据分析应用程序
- Spark与Hadoop的区别() A: Spark是基于硬盘计算框架,而Hadoop基于内存计算框架 B: Spark是基于内存计算框架,而Hadoop基于硬盘计算框架 C: Spark只适合离线处理计算框架,而Hadoop是一站式计算框架 D: Spark是一站式计算框架,而Hadoop只适合离线处理计算框架