Hadoop系统的组成及其基本工作原理中,请谈谈对数据流处理工具Pig的理解。
Pig是一个用来处理大规模数据集的平台,由Yahoo!贡献给Apache成为开源项目。它简化了使用Hadoop进行数据分析处理的难度,提供一个面向领域的高层抽象语言PigLatin,通过该语言,程序员可以将复杂的数据分析任务实现为Pig操作上的数据流脚本,这些脚本最终执行时将被系统自动转换为MapReduce任务链,在Hadoop上加以执行。Yahoo!有大量的MapReduce作业是通过Pig实现的。
本题目来自[网课答案]本页地址:https://www.wkda.cn/ask/zxxojjpoemxemxo.html
举一反三
内容
- 0
描绘系统各组件处理及其之间数据流的主要工具是
- 1
Hadoop善于处理静态数据,流计算框架善于处理动态数据
- 2
数据流图也成为数据流程图,是一种便于用户理解和()系统数据流程的()工具。
- 3
数据流程图的四个基本组成要素是 【12】 、数据流、加工处理和数据存储。
- 4
13-7描绘系统各组件处理及其之间数据流的主要工具是() A: 数据流图 B: 结构图 C: 系统流程图 D: 实体关系图