使用Hadoop进行迭代计算的开销非常大,这是因为每次迭代都需要()
A: 从磁盘中写入、读取中间数据
B: 从内存中写入、读取中间数据
C: 从磁盘中读取中间数据,将最终结果保存在内存中
D: 从内存中读取中间数据,将最终结果保存在磁盘中
A: 从磁盘中写入、读取中间数据
B: 从内存中写入、读取中间数据
C: 从磁盘中读取中间数据,将最终结果保存在内存中
D: 从内存中读取中间数据,将最终结果保存在磁盘中
举一反三
- 【单选题】下列说法哪项有误? A. 相对于Spark来说,使用Hadoop进行迭代计算非常耗资源 B. Spark将数据载入内存后,之后的迭代计算都可以直接使用内存中的中间结果作运算,避免了从磁盘中频繁读取数据 C. Hadoop的设计遵循“一个软件栈满足不同应用场景”的理念 D. Spark可以部署在资源管理器YARN之上,提供一站式的大数据解决方案
- ()将从磁盘读取的数据存在快取内存(cachememory)中以减少磁盘存取的次数,数据的读写都在快取内存中进行,大幅增加存取的速度,如要读取的数据不在快取内存中,或要写数据到磁盘时,才做磁盘的存取动作。 A: 磁盘陈列 B: 磁盘快取控制 C: 磁盘复制 D: 磁盘群集
- ()将从磁盘读取的数据存在快取内存(cache memory)中以减少磁盘存取的次数,数据的读写都在快取内存中进行,大幅增加存取的速度,如要读取的数据不在快取内存中,或要写数据到磁盘时,才做磁盘的存 取动作。 A: A磁盘陈列 B: B磁盘快取控制 C: C磁盘复制 D: D磁盘群集
- 如果希望从磁盘文件读取数据,或者将数据写入文件,还需要使用文件输入输出流类 _______ 和_________
- __________负责管理元数据,客户端每次读写请求时,都会从磁盘中读取或写入元数据信息并反馈给客户端。