Spark与Hadoop的对比,优势是()。
A: 减少磁盘I/O
B: 减少应用程序上传成本
C: 增强任务并行度
D: 避免重新计算
A: 减少磁盘I/O
B: 减少应用程序上传成本
C: 增强任务并行度
D: 避免重新计算
举一反三
- 如何使用检查点来提高性能? () A: 如果频繁实施检查点,可以减少DBWn上的工作负荷 B: 启用检查点自动调整将优化磁盘I/O C: 减少MTTR将减少磁盘I/O D: 增加MTTR将减少磁盘I/O
- Spark与Hadoop的区别() A: Spark是基于硬盘计算框架,而Hadoop基于内存计算框架 B: Spark是基于内存计算框架,而Hadoop基于硬盘计算框架 C: Spark只适合离线处理计算框架,而Hadoop是一站式计算框架 D: Spark是一站式计算框架,而Hadoop只适合离线处理计算框架
- 下列对hadoop和spark的描述错误的是 A: hadoop的编程范式:map+reduce,spark的编程范式是DAG:transformation+action B: hadoop计算中间结果落到磁盘,io及序列化、反序列化代价大,spark在内存中维护存取速度比磁盘高几个数据级 C: hadoop的Task以进程的方式维护需要数秒时间才能启动任务,spark的任务以线程的方式维护对于小数据集读取能够达到亚秒级的延迟 D: hadoop和spark都是对磁盘进行数据的读写
- 与Hadoop对比,Spark的优点包括() A: Spark的计算结果放在内存中,节省了磁盘存储空间。 B: Spark的计算模式也属于MapReduce,但编程模型比MapReduce更灵活。 C: Spark提供了内存计算,中间结果放到内存中,提高了迭代运算效率。 D: Spark基于DAG的任务调度执行机制,性能优于MapReduce的迭代执行机制。
- 对磁盘请求重新排队的目的是______。 A: 重置移臂时间 B: 让优先级高的进程先I/O C: 减少传输时间 D: 减少旋转时间