• 2022-06-28
    使用requests模块爬取网页内容时,返回状态码为()表示爬取成功
    A: 404
    B: 403
    C: 200
    D: 503
  • C

    内容

    • 0

      ( )网络爬虫在爬取网页时,只爬取内容发生变化的网页或新产生的网页,对于未发生内容变化的网页,则不会爬取。 A: 通用 B: 深层 C: 聚焦 D: 增量式

    • 1

      使用requests爬取页面时,为了保存用户cookie可以使用下列哪个对象( )。

    • 2

      Python中提供的requests 库的get()方法能够实现爬取网页信息的功能。( )

    • 3

      网站遇到紧急问题,需要临时关闭时,以下哪种设置更合理() A: 先返回301状态,然后跳转到404页面,返回404状态 B: 先返回302状态,然后跳转到404页面,返回404状态 C: 先返回302状态,然后跳转到503页面,返回503状态 D: 先返回301状态,然后跳转到503页面,返回503状态

    • 4

      永久重定向的HTTP状态码是() A: 200 B: 301 C: 404 D: 503