DStream的内部结构是由一系列连续的RDD组成,每个RDD都是一小段时间间隔开的数据集。
举一反三
- DStream是一系列连续的RDD来表示。每个RDD含有一段时间间隔内的数据
- RDD 表示只读的分区的数据集,对 RDD 进行改动,只能通过 RDD 的转换操作。( )
- 窄依赖表现为( )。(注意:本题为多选题) A: 一个父RDD对应一个子RDD B: 一个父RDD对应多个子RDD C: 多个父RDD对应一个子RDD D: 多个父RDD对应多个子RDD
- 下列关于弹性分布式数据集(RDD)的表述不正确的是 A: RDD是一个数据库 B: RDD是一个分布式的数据结构 C: RDD是一个数据抽象类型 D: RDD是一个编程范式
- 关于RDD,下列说法错误的是?() A: RDD具有血统机制(Lineage) B: RDD默认存储在磁盘 C: RDD是一个只读的,可分区的分布式数据集 D: RDD是Spark对基础数据的抽象