• 2022-06-27
    在Spark中,Spark MLlib的主要功能是( )。
    A: 用来操作结构化数据
    B: 实现 Spark 的基本功能,包含任务调度、内存管理、错误恢复、与存储系统交互等
    C: 提供常见的机器学习功能
    D: 高效地在一个计算节点到数千个计算节点之间伸缩计算
  • C

    举一反三

    内容

    • 0

      Spark生态系统中包括了多个组件,其中Spark SQL的功能是() A: 允许开发人员直接处理RDD,同时也可以查询Hive、HBase等外部数据源。 B: 包含了Spark的基本功能,如内存计算、任务调度、部署模式、故障恢复、存储管理等,主要面向批数据处理。 C: 支持高吞吐量、可容错的处理的实时流数据处理。 D: 提供了常用机器学习算法的实现,包括聚类、分类、回归、协同过滤等。

    • 1

      Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎,在下面的Spark库中,哪一个是用于机器学习的( )。 A: Spark SQL B: MLlib C: GraphX D: Spark Streaming

    • 2

      Spark生态系统中用于机器学习的组件是( )。 A: Spark Core B: GraphX C: Mllib D: Spark Streaming

    • 3

      以下关于MapReduce和Spark的说法,错误的是( )。 A: Spark中没有map和reduce操作。 B: MapReduce不适合迭代计算。 C: Spark提供了内存计算,可将中间结果放到内存中,对于迭代运算效率更高。 D: Spark基于DAG的任务调度执行机制,要优于Hadoop MapReduce的迭代执行机制。

    • 4

      Spark相对于Hadoop MapReduce,其优点在于() A: Spark对数据集可以执行的操作少于MapReduce B: Spark执行时间与Hadoop相差无几 C: Spark提供了内存计算 D: Spark基于MapReduce的迭代执行机制