Hive 在加载数据过程中不会对数据进行任何的修改,只是将数据移动到HDFS 中Hive 设定的目录下,因此,Hive 不支持对数据的改写和添加,所有的数据都是在加载的时候确定的。
举一反三
- Hive本身是没有专门的数据存储格式,也没有为数据建立索引,只需要在创建表的时候告诉Hive数据中的列分隔符和行分隔符,Hive就可以解析数据,所以往Hive表里面导入数据只是简单的将数据移动到表所在的目录中。
- Hive本身提供了一系列对数据进行提取、转换、加载(ETL)的工具,可以对存储在HDFS中的大规模数据进行查询和分析。
- 下列选项中,关于Hive说法错误的是() A: Hive主要用来对数据进行抽取、转换、加载操作 B: Hive可以将非结构化数据映射为一张数据表 C: Hive支持类SQL的查询语言 D: Hive是基于Hadoop的数据仓库工具
- 下面关于Hive的描述错误的是( ) A: Hive依赖于HDFS处理数据 B: Hive依赖于MapReduce处理数据 C: Hive将处理结果保存到HDFS中 D: 在某些场景下Pig可以作为Hive的替代工具
- Hive中的元数据,以及所存储数据集都是存储在HDFS系统中。