聚焦网络爬虫又称主题网络爬虫,是指选择性地爬行那些与预先定义好的主题相关页面的网络爬虫。请简述常用的爬行策略有哪些?
举一反三
- 聚焦网络爬虫常用的爬行策略有深度优先策略、广度优先策略。()
- ()是指对已下载网页采取增量式更新和只爬行新产生的或者已经发生变化网页的爬虫,它能够在一定程度上保证所爬行的页面是尽可能新的页面。 A: 聚焦网络爬虫 B: 增量式网络爬虫 C: 通用网络爬虫 D: 深层网络爬虫
- 下列选项中,被称为主题网络爬虫的是()。 A: 增量式网络爬虫 B: 通用网络爬虫 C: 深层爬虫 D: 聚焦网络爬虫
- ()又称全网爬虫,爬行对象从一些种子URL扩充到整个Web,主要为门户站点搜索引擎和大型Web服务提供商采集数据。 A: 聚焦网络爬虫 B: 增量式网络爬虫 C: 通用网络爬虫 D: 深层网络爬虫
- 聚焦爬虫是“面向特定主题需求”的一种网络爬虫程序。 ()