下列Hadoop生态圈内项目描述错误的为( )。
A: Flume是一个分布式、可靠和高可用的海量日志采集、聚合和传输的系统
B: Spark是一个相对独立于Hadoop的大数据处理系统,可单独进行分布式处理
C: Oozie支持Hadoop集群的管理、监控的Web工具
D: Hive建立在Hadoop上的数据仓库,提供类似SQL查询Hadoop中的数据
A: Flume是一个分布式、可靠和高可用的海量日志采集、聚合和传输的系统
B: Spark是一个相对独立于Hadoop的大数据处理系统,可单独进行分布式处理
C: Oozie支持Hadoop集群的管理、监控的Web工具
D: Hive建立在Hadoop上的数据仓库,提供类似SQL查询Hadoop中的数据
举一反三
- Hive是一个基于Hadoop的数据仓库工具,可以用于对Hadoop文件中的数据集进行数据整理、特殊查询和分布存储。
- -1( )是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在( )中的大规模数据的机制。 A: Hive,Hadoop B: Hadoop,Hive C: MongoDB,Hadoop D: HBase,Hadoop
- hadoop是Apache基金会开发的一款分布式系统基础架构,主要解决海量数据存储和海量数据计算两大问题,从广义上来说,hadoop通常指的是hadoop生态圈。( )
- 下面关于Hadoop的描述错误的是:() A: Hadoop是一个能够对大量数据进行分布式处理的软件框架 B: 作为并行分布式计算平台,Hadoop采用分布式存储和分布式处理两大核心技术,能够高效地处理PB级数据 C: Hadoop只支持Java编程语言 D: Hadoop可以高效稳定地运行在廉价的计算机集群上,可以扩展到数以千计的计算机节点上
- hive是hadoop上处理结构化的数据仓库基础工具,可以处理海量数据。