【判断题】适合用 MapReduce 来处理的数据集(或任务)有一个基本要求: 待处理的数据集可以分解成许多小的数据集,而且每一个小数据集都可以完全并行地进行处理
举一反三
- MapReduce计算模型的描述,错误的是( ) A: MapReduce采用的是一种分而治之的思想 B: MapReduceMapReduce要求待处理数据集可以分解为能并行处理的小数据集 C: MapReduce适合于实时在线任务的应用场景 D: MapReduce可以处理离线任务
- MapReduce是处理大数据的有力工具,但不是每个任务都可以使用MapReduce来进行处理。试述适合用MapReduce来处理的任务或者数据集需满足怎样的要求。
- Hive 中的“Group by”指的是通过一定规则将一个数据集划分成若干个小的数据集,然 后针对若干个小的数据集进行数据分组处理。()
- 适合用MapReduce来处理的任务和数据集需要满足怎样的要求?
- Hive中Group By指的是通过一定的规则将一个数据集划分为若干个小的数据集,然后针对若干个小的数据集进行数据分组处理