• 2022-06-27
    Spark的四大组件为Spark Streaming、Mlib、Graphx、Spark R。( )
  • 内容

    • 0

      Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎,在下面的Spark库中,哪一个是用于机器学习的( )。 A: Spark SQL B: MLlib C: GraphX D: Spark Streaming

    • 1

      在Spark生态系统组件的应用场景中,下列哪项说法是错误的? A: Spark应用在复杂的批量数据处理 B: Spark SQL是基于历史数据的交互式查询 C: Spark Streaming是基于历史数据的数据挖掘 D: GraphX是图结构数据的处理

    • 2

      下面属于批处理技术的是: A: MapReduce B: Storm C: Spark Streaming D: GraphX

    • 3

      Spark Streaming 是Spark系统中用于实时处理流数据的分布式流处理框架,扩展了Spark流式大数据处理能力。

    • 4

      spark读取hdfs数据是调用哪个技术实现的() A: spark?core B: spark?streaming C: mapreduce D: Grophx