• 2022-10-27
    随着数据集规模的不断增大,而传统BI的数据处理成本过高,企业对Hadoop及相关的廉价数据处理技术如Hive、HBase、MapReduce、Pig等的需求将持续增长。关于大数据存储技术,最典型的路线有三种:用MPP(massivlyparallel processing)架构的新型数据库集群、基于Hadp的技术扩展和封装以及大数据—体机。下面关于这三种大数据储存技术的说法中错误的是()
    A: MPP架构采用高效的分布式计算模式,具有高性能和高扩展性的特点
    B: 由于MPP产品无法支撑大规模(PB级)的结构化敌据分析,因此只适用于传统、数据规模较小的企业的数据仓库
    C: Hadoop平台擅长处理非结构、半结构化数据、复杂的ETL流程、复杂的数据挖掘和计算模型
    D: 大数据─体机由一组集成的服务器、存储设备、操作系统、数据库管理系统以及为数据查询、处理、分析用途而特别预先安装及优化的软件组成
  • A

    内容

    • 0

      大数据分析的流程()? A: 数据准备 B: 数据存储与管理 C: 计算处理 D: 数据分析 E: 知识展现

    • 1

      以下属于大数据的技术组成的是 A: 大数据存储软件(技术) B: 大数据架构设计(技术) C: 大数据实时计算(技术) D: 大数据数据采集(技术)

    • 2

      下面哪个选项属于大数据技术的“数据存储和管理”技术层面的功能? A: 利用分布式文件系统、数据仓库、关系数据库等实现对结构化、半结构化和非结构化海量数据的存储和管理 B: 利用分布式并行编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析 C: 构建隐私数据保护体系和数据安全体系,有效保护个人隐私和数据安全 D: 把实时采集的数据作为流计算系统的输入,进行实时处理分析

    • 3

      大数据处理中的数据分析根据不同层次大致可分为3类:计算架构、以及数据分析和处理() A: 支撑技术 B: 数据解释 C: 查询与索引 D: 数据的收集管理

    • 4

      大数据处理和分析的两大核心技术就是分布式存储和()。 A: 分布式处理 B: 并行处理(MPP)数据库 C: 数据挖掘 D: 云计算平台