大数据采集的工具常用的有四种,下列哪个选项不是数据采集的工具
A: Chukwa
B: Processing
C: Scribe
D: Flume
A: Chukwa
B: Processing
C: Scribe
D: Flume
举一反三
- 下面哪一种不是大数据中日志采集的工具?( ) A: 、Facebook的Scribe B: 、Hadhoop的Chukwa C: 、Cloudra的Flume D: 、Google的BigTable
- 以下不能进行系统日志数据采集的工具是()O A: Hadoop B: Python C: Scribe D: Flume
- 常用的大数据采集工具不包括() A: Flume B: Squop C: Kafka D: Scrapy
- 下列关于互联网数据,说法错误的是( ) A: 使用海量数据采集工具用于进行采集,比如Facebook公司的Scribe,Hadoop平台的Chukwa,Cloudera公司的Flume,这些工具均采用分布式架构,能满足每秒数百MB的日志数据采集和传输需求。 B: 特点是数据量大、更新快、数据价值低、语义不明确、数据类型多 C: 互联网数据采集通过网络爬虫采集,网络爬虫(又称为网页蜘蛛,网络机器人),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。 D: 互联网数据是指社交网络、互联网产生的数据。博客、微信、QQ、推特、维基等产生的电子邮件、文档、图片、音频、视频等数据。
- 下列关于互联网数据,说法错误的是( ) A: 使用海量数据采集工具用于进行采集,比如Facebook公司的Scribe,Hadoop平台的Chukwa,Cloudera公司的Flume,这些工具均采用分布式架构,能满足每秒数百MB的日志数据采集和传输需求。 B: 互联网数据采集通过网络爬虫采集,网络爬虫(又称为网页蜘蛛,网络机器人),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。 C: 特点是数据量大、更新快、数据价值低、语义不明确、数据类型多 D: 互联网数据是指社交网络、互联网产生的数据。博客、微信、QQ、推特、维基等产生的电子邮件、文档、图片、音频、视频等数据。