网络爬虫(Web Crawler)是一个自动下载网页的计算机程序或______ 脚本,是______ 的重要组成部分。
自动化:)搜索引擎
举一反三
内容
- 0
()是一种自动下载网页的计算机程序和自动化脚本,通常从一个成为种子集开始运行,按照一定序列或者条件爬取页面信息,最终遍历整个Web网页。 A: 传感器 B: 系统日志 C: Web爬虫 D: 数据库
- 1
网络爬虫是指一种按照一定的规则自动或人工抓取互联网信息的程序或者脚本,是搜索引擎抓取系统的重要组成部分。()
- 2
下面关于网络爬虫的描述错误的是:( ) A: 网络爬虫是一个自动提取网页的程序 B: 为搜索引擎从万维网上下载网页,是搜索引擎的重要组成部分 C: 爬虫从一个或若干个初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件 D: 网络爬虫的行为和人们访问网站的行为是完全不同的
- 3
网络爬虫是指为搜索引擎下载并存储网页的程序,是搜索引擎和Web缓存的主要数据采集方式。
- 4
网络爬虫,又称为网页蜘蛛、网络机器人,是一种按照 ,自动请求万维网网站并 的程序或脚本。 A: 一定的规则 B: 随意的爬虫规则 C: 提取网站数据 D: 提取网络数据