Hadoop是一种开源、高可靠性、伸缩性强的分布式计算系统,主要用于对大于1TB的海量数据的处理。
举一反三
- Hadoop是一个处理、存储和分析海量的分布式、非结构化数据的开源框架。
- Hadoop凭借能够部署在廉价的集群上,凭借其开源、扩展性强、容错性好等优势,成为主流的开源大数据系统。其核心的存储和计算框架是? A: 分布式文件系统HDFS B: 流处理计算框架 C: 分布式数据计算框架MapReduce D: 即席查询计算框架
- 以下对Hadoop生态系统中的组件解释不正确的是: A: HDFS:分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开源实现 B: HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌BigTable的开源实现 C: Hive:一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储 D: Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统
- Hadoop被公认为恒业大数据标准开源软件,在()环境下提供海量数据的处理 A: 分页式 B: 并行化 C: 集成处理 D: 分布式
- hadoop是Apache基金会开发的一款分布式系统基础架构,主要解决海量数据存储和海量数据计算两大问题,从广义上来说,hadoop通常指的是hadoop生态圈。( )