• 2022-06-19
    ______ 作为 Spark大数据框架的一部分,主要用于结构化数据处理和对 Spark数据执行类SQL的查询
  • SparkSQL

    内容

    • 0

      Spark SQL作为分布式SQL查询引擎,让用户可以通过()方式实现对结构化数据的处理。 A: SQL B: Shark C: DataFrames API D: Datasets API

    • 1

      下面关于为什么推出Spark SQL的原因的描述正确的是: A: Spark SQL可以提供DataFrame API,可以对内部和外部各种数据源执行各种关系操作 B: 可以支持大量的数据源和数据分析算法,组合使用Spark SQL和Spark MLlib,可以融合传统关系数据库的结构化数据管理能力和机器学习算法的数据处理能力 C: Spark SQL无法对各种不同的数据源进行整合 D: Spark SQL无法融合结构化数据管理能力和机器学习算法的数据处理能力

    • 2

      在Spark生态系统组件的应用场景中,下列哪项说法是错误的? A: Spark应用在复杂的批量数据处理 B: Spark SQL是基于历史数据的交互式查询 C: Spark Streaming是基于历史数据的数据挖掘 D: GraphX是图结构数据的处理

    • 3

      关于Spark的说法正确的是 A: Spark是基于内存的实时数据分析框架 B: Spark是基于内存计算的大数据并行计算框架 C: Spark用206个节点对100TB数据做基准排序需23分 D: Spark可用于构建大型的、低延迟的数据分析应用程序

    • 4

      SparkSQL是Spark用来处理结构化数据的一个模块,它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用