是一个开源分布式计算平台,通过Hadoop分布式文件系统HDFS存储大量数据,再通过MapReduce的编程模型将这些数据的操作分成小片段
Apache Hadoop
举一反三
- 下列属于大数据关键技术的是() A: Hadoop分布式存储和计算平台 B: HDFS分布式文件系统 C: MapReduce分布式计算框架 D: NoSQL数据库
- Hadoop是最常见的大数据技术框架,Hadoop最核心的技术是HDFS(分布式文件系统)和MapReduce(分布式计算框架)。
- ()是Hadoop分布式文件系统,是Hadoop生态系统中的数据存储基础。 A: MapReduce B: HBase C: HDFS D: Hive
- HDFS分布式文件系统,是谷歌文件系统GFS的开源实现,而Hadoop MapReduce也是针对谷歌MapReduce的开源实现。
- Hadoop的核心组件有? A: HDFS(分布式文件系统) B: YARN(运算资源调度系统) C: MAPREDUCE(分布式运算编程框架) D: SQOOP数据迁移工具
内容
- 0
1.狭义的Hadoop是一个适合大数据分布式存储和分布式计算的平台,不包括下面哪个组件?( ) A: HDFS B: MapReduce C: Yarn D: HBase
- 1
Hadoop平台具有两大核心,一个是分布式文件系统HDFS,一个是分布式并行框架MapReduce
- 2
以下关于分布式文件系统,描述错误的是( )。 A: 布式文件系统的设计采用C/S和B/W/S模式 B: 是一种通过网络实现文件在多台主机上进行分布式存储的文件系统 C: 谷歌开发了分布式文件系统GFS D: HAdoop分布式文件系统(HAdoop Distributed File System,HDFS)是针对GFS的开源实现
- 3
Hadoop凭借能够部署在廉价的集群上,凭借其开源、扩展性强、容错性好等优势,成为主流的开源大数据系统。其核心的存储和计算框架是? A: 分布式文件系统HDFS B: 流处理计算框架 C: 分布式数据计算框架MapReduce D: 即席查询计算框架
- 4
Hadoop的核心是分布式文件系统HDFS和MapReduce。