• 2022-06-19
    Spark生态系统中用于流计算的组件是( )。
    A: Spark Core
    B: GraphX
    C: Spark SQL
    D: Spark Streaming
  • D

    内容

    • 0

      在Spark生态系统组件的应用场景中,下列哪项说法是错误的? A: Spark应用在复杂的批量数据处理 B: Spark SQL是基于历史数据的交互式查询 C: Spark Streaming是基于历史数据的数据挖掘 D: GraphX是图结构数据的处理

    • 1

      Spark Streaming 是Spark系统中用于实时处理流数据的分布式流处理框架,扩展了Spark流式大数据处理能力。

    • 2

      spark读取hdfs数据是调用哪个技术实现的() A: spark?core B: spark?streaming C: mapreduce D: Grophx

    • 3

      以下哪个组件是Spark中的机器学习算法库:( ) A: MLlib B: Spark Core C: Machine Leaning D: Spark SQL

    • 4

      关于Spark描述错误的是 A: Spark SQL是Spark提供的对实时数据进行流式计算的组件 B: Spark是一个用来实现快速而通用的集群计算的平台 C: Spark适用于各种各样的分布式平台场景,包括批处理、迭代算法、交互式查询、流处理等 D: Spark core实现Spark的基本功能