下面哪一种不是大数据中日志采集的工具?( )
A: 、Facebook的Scribe
B: 、Hadhoop的Chukwa
C: 、Cloudra的Flume
D: 、Google的BigTable
A: 、Facebook的Scribe
B: 、Hadhoop的Chukwa
C: 、Cloudra的Flume
D: 、Google的BigTable
举一反三
- 大数据采集的工具常用的有四种,下列哪个选项不是数据采集的工具 A: Chukwa B: Processing C: Scribe D: Flume
- 以下不能进行系统日志数据采集的工具是()O A: Hadoop B: Python C: Scribe D: Flume
- 以下关于日志采集工具Flume的说法不正确的是 A: Flume是一个分布式、可靠和高可用的海量日志采集、聚合和传输的日志收集系统 B: Flume的数据源和目标都是可定制、可扩展的 C: Flume支持多级级联和多路复制 D: Flume适用于大量数据的实时数据采集
- 下列关于互联网数据,说法错误的是( ) A: 使用海量数据采集工具用于进行采集,比如Facebook公司的Scribe,Hadoop平台的Chukwa,Cloudera公司的Flume,这些工具均采用分布式架构,能满足每秒数百MB的日志数据采集和传输需求。 B: 特点是数据量大、更新快、数据价值低、语义不明确、数据类型多 C: 互联网数据采集通过网络爬虫采集,网络爬虫(又称为网页蜘蛛,网络机器人),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。 D: 互联网数据是指社交网络、互联网产生的数据。博客、微信、QQ、推特、维基等产生的电子邮件、文档、图片、音频、视频等数据。
- 下列关于互联网数据,说法错误的是( ) A: 使用海量数据采集工具用于进行采集,比如Facebook公司的Scribe,Hadoop平台的Chukwa,Cloudera公司的Flume,这些工具均采用分布式架构,能满足每秒数百MB的日志数据采集和传输需求。 B: 互联网数据采集通过网络爬虫采集,网络爬虫(又称为网页蜘蛛,网络机器人),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。 C: 特点是数据量大、更新快、数据价值低、语义不明确、数据类型多 D: 互联网数据是指社交网络、互联网产生的数据。博客、微信、QQ、推特、维基等产生的电子邮件、文档、图片、音频、视频等数据。