• 2022-06-19
    非完全PageRank策略的思想是( )
    A: 将新下载网页包含的链接直接追加到待抓取URL队列末尾
    B: 利用Pagerank思想对待抓取URL优先级进行排序
    C: 在算法开始之前,每个互联网网页都给予相同的cash,每当下载了某个网页P后,P将自己拥有的cash平均分配给页面中包含的链接页面,对于待抓取的页面。根据手头拥有的cash金额排序,优先下载cash多的网页
    D: 对于待抓取URL队列中的网页,根据所属网站归类,如果哪个网站等待下载的页面最多,则优先下载这些链接