有关分布式机器学习的说法,错误的是哪个?
A: 分布式机器学习需要依赖Hadoop、Spark等分布式存储和计算框架。
B: 分布式机器学习面对的首要问题主要是数据量,而不是速度的问题。
C: 对运算速度要求高的机器学习算法可以优先使用Spark计算框架。
D: 分布式计算可以在单个常规的服务器上运行。
A: 分布式机器学习需要依赖Hadoop、Spark等分布式存储和计算框架。
B: 分布式机器学习面对的首要问题主要是数据量,而不是速度的问题。
C: 对运算速度要求高的机器学习算法可以优先使用Spark计算框架。
D: 分布式计算可以在单个常规的服务器上运行。
举一反三
- ______ 是一个分布式机器学习库,即在Spark平台上对一些常用的机器学习算法进行了分布式实现
- ( )是一个分布式机器学习库,即在Spark平台上对一些常用的机器学习算法进行了分布式实现。 A: Data Manager B: MLlib C: Spark Runtime D: Spark SQL
- 分布式计算和并行计算相结合产生“并行分布式计算”和“分布并行式计算”,MapReduce计算模型采用的是计算的思想。
- 下面哪个针对MapReduce的说法是错误的? A: MapReduce是支持分布式机器学习算法的计算框架。 B: MapReduce的运行需要基础的分布式存储系统HDFS支持。 C: MapReduce可以对分布式的大数据分片进行并行的实时分析。 D: MapReduce上的数据分析属于数据并行计算类型。
- 对于爬虫描述错误的是 A: 分布式爬虫和对等式分布爬虫主要是存储物理位置有区别 B: 对于主从式分布爬虫,不同的服务器承担不同的角色分工 C: 对于对等式分布爬虫,每台服务器承担相同的功能 D: 一个大型分布式爬虫的3个等级:分布式数据中心、分布式抓取服务器、分布式爬虫程序