下列对hadoop和spark的描述错误的是
A: hadoop的编程范式:map+reduce,spark的编程范式是DAG:transformation+action
B: hadoop计算中间结果落到磁盘,io及序列化、反序列化代价大,spark在内存中维护存取速度比磁盘高几个数据级
C: hadoop的Task以进程的方式维护需要数秒时间才能启动任务,spark的任务以线程的方式维护对于小数据集读取能够达到亚秒级的延迟
D: hadoop和spark都是对磁盘进行数据的读写
A: hadoop的编程范式:map+reduce,spark的编程范式是DAG:transformation+action
B: hadoop计算中间结果落到磁盘,io及序列化、反序列化代价大,spark在内存中维护存取速度比磁盘高几个数据级
C: hadoop的Task以进程的方式维护需要数秒时间才能启动任务,spark的任务以线程的方式维护对于小数据集读取能够达到亚秒级的延迟
D: hadoop和spark都是对磁盘进行数据的读写
举一反三
- 关于Hadoop和Spark的相互关系,以下说法正确的是 A: Hadoop和Spark可以相互协作 B: Hadoop负责数据的存储和管理 C: Spark负责数据的计算 D: Spark要操作Hadoop中的数据,需要先启动HDFS
- spark和hadoop对比,说法正确的是? A: Hadoop中间结果会存储在磁盘上 B: spark中间结果会存储在内存中 C: Spark已经完全取代hadoop D: Spark相对于hadoop提供了更多的操作
- Spark相对于Hadoop MapReduce,其优点在于() A: Spark对数据集可以执行的操作少于MapReduce B: Spark执行时间与Hadoop相差无几 C: Spark提供了内存计算 D: Spark基于MapReduce的迭代执行机制
- Hadoop和 Spark都是大数据的分析技术
- 与Hadoop对比,Spark的优点包括() A: Spark的计算结果放在内存中,节省了磁盘存储空间。 B: Spark的计算模式也属于MapReduce,但编程模型比MapReduce更灵活。 C: Spark提供了内存计算,中间结果放到内存中,提高了迭代运算效率。 D: Spark基于DAG的任务调度执行机制,性能优于MapReduce的迭代执行机制。