与RDD类似,DataFrame也是一个分布式数据容器
举一反三
- 下列关于弹性分布式数据集(RDD)的表述不正确的是 A: RDD是一个数据库 B: RDD是一个分布式的数据结构 C: RDD是一个数据抽象类型 D: RDD是一个编程范式
- Spark SQL作为分布式SQL查询引擎,让用户可以通过( )实现对结构化数据的处理。 A: SQL B: DataFrame API C: Dataset API D: RDD API
- 关于RDD,下列说法错误的是?() A: RDD具有血统机制(Lineage) B: RDD默认存储在磁盘 C: RDD是一个只读的,可分区的分布式数据集 D: RDD是Spark对基础数据的抽象
- 在创建DataFrame之前,为了支持RDD转换成DataFrame及后续的SQL操作,需要导入【】包启用隐式转换。
- DataFrame 和 RDD 最大的区别( )