Hadoop是基于Apple有关大数据的论文实现的开源项目。
举一反三
- 目前,企业主流的大数据解决方法基于Hadoop开源项目。
- Hadoop是一个开源的大数据分析软件,集合了大数据不同阶段技术的生态系统,其核心是spark。( )
- 以下对Hadoop生态系统中的组件解释不正确的是: A: HDFS:分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开源实现 B: HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌BigTable的开源实现 C: Hive:一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储 D: Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统
- HIVE是基于Hadoop分布式文件系统的、开源的、结构化数据表。( )
- 以下哪个不是基于Hadoop平台衍生出来的开源项目 A: HBase B: Sqoop C: Avanta D: pig