在Spark中,Spark MLlib的主要功能是( )。
A: 用来操作结构化数据
B: 实现 Spark 的基本功能,包含任务调度、内存管理、错误恢复、与存储系统交互等
C: 提供常见的机器学习功能
D: 高效地在一个计算节点到数千个计算节点之间伸缩计算
A: 用来操作结构化数据
B: 实现 Spark 的基本功能,包含任务调度、内存管理、错误恢复、与存储系统交互等
C: 提供常见的机器学习功能
D: 高效地在一个计算节点到数千个计算节点之间伸缩计算
C
举一反三
- 在Spark中,Spark Core的主要功能是( )。 A: 用来操作结构化数据 B: 高效地在一个计算节点到数千个计算节点之间伸缩计算 C: 实现 Spark 的基本功能,包含任务调度、内存管理、错误恢复、与存储系统交互等 D: 对实时数据进行流式计算
- 在Spark中,Spark SQL的主要功能是( )。 A: 高效地在一个计算节点到数千个计算节点之间伸缩计算 B: 实现 Spark 的基本功能,包含任务调度、内存管理、错误恢复、与存储系统交互等 C: 对实时数据进行流式计算 D: 用来操作结构化数据
- ( )是构建在Spark上的图计算模型,它利用Spark框架提供的内存缓存RDD、DAG和基于数据依赖的容错等特性,实现高效健壮的图计算框架。 A: Data Manager B: MLlib C: Spark Runtime D: GraphX
- 关于Spark描述错误的是 A: Spark SQL是Spark提供的对实时数据进行流式计算的组件 B: Spark是一个用来实现快速而通用的集群计算的平台 C: Spark适用于各种各样的分布式平台场景,包括批处理、迭代算法、交互式查询、流处理等 D: Spark core实现Spark的基本功能
- Spark相对于MapReduce的优点包括:( ) A: Spark的计算模式也属于MapReduce,但不局限于Map和Reduce操作,还提供了多种数据集操作类型,编程模型比MapReduce更灵活 B: Spark提供了内存计算,中间结果直接放到内存中,带来了更高的迭代运算效率 C: Spark同时提供了存储功能,而MapReduce不支持存储 D: Spark基于DAG的任务调度执行机制,要优于MapReduce的迭代执行机制
内容
- 0
Spark生态系统中包括了多个组件,其中Spark SQL的功能是() A: 允许开发人员直接处理RDD,同时也可以查询Hive、HBase等外部数据源。 B: 包含了Spark的基本功能,如内存计算、任务调度、部署模式、故障恢复、存储管理等,主要面向批数据处理。 C: 支持高吞吐量、可容错的处理的实时流数据处理。 D: 提供了常用机器学习算法的实现,包括聚类、分类、回归、协同过滤等。
- 1
Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎,在下面的Spark库中,哪一个是用于机器学习的( )。 A: Spark SQL B: MLlib C: GraphX D: Spark Streaming
- 2
Spark生态系统中用于机器学习的组件是( )。 A: Spark Core B: GraphX C: Mllib D: Spark Streaming
- 3
以下关于MapReduce和Spark的说法,错误的是( )。 A: Spark中没有map和reduce操作。 B: MapReduce不适合迭代计算。 C: Spark提供了内存计算,可将中间结果放到内存中,对于迭代运算效率更高。 D: Spark基于DAG的任务调度执行机制,要优于Hadoop MapReduce的迭代执行机制。
- 4
Spark相对于Hadoop MapReduce,其优点在于() A: Spark对数据集可以执行的操作少于MapReduce B: Spark执行时间与Hadoop相差无几 C: Spark提供了内存计算 D: Spark基于MapReduce的迭代执行机制