Hadoop和 Spark都是大数据的分析技术
举一反三
- Hadoop是一个开源的大数据分析软件,集合了大数据不同阶段技术的生态系统,其核心是spark。( )
- 关于Hadoop和Spark的相互关系,以下说法正确的是 A: Hadoop和Spark可以相互协作 B: Hadoop负责数据的存储和管理 C: Spark负责数据的计算 D: Spark要操作Hadoop中的数据,需要先启动HDFS
- Hadoop不适合的场景有:() A: 大数据分析 B: 离线分析 C: 复杂数据
- 以下哪些技术为大数据常用框架或技术: A: Hadoop B: Spark C: HBase D: Linux
- 下列对hadoop和spark的描述错误的是 A: hadoop的编程范式:map+reduce,spark的编程范式是DAG:transformation+action B: hadoop计算中间结果落到磁盘,io及序列化、反序列化代价大,spark在内存中维护存取速度比磁盘高几个数据级 C: hadoop的Task以进程的方式维护需要数秒时间才能启动任务,spark的任务以线程的方式维护对于小数据集读取能够达到亚秒级的延迟 D: hadoop和spark都是对磁盘进行数据的读写