关于网络爬虫协议文件robots.txt,说法错误的是()
A: 一个网站可以放多个不同robots文件
B: robots文件不可以用xml格式命名
C: disallow用来描述不希望被访问到的一个URL
D: robots文件可以放在任何位置
A: 一个网站可以放多个不同robots文件
B: robots文件不可以用xml格式命名
C: disallow用来描述不希望被访问到的一个URL
D: robots文件可以放在任何位置
举一反三
- 下面哪个说法是不正确的?? Robots协议可以作为法律判决的参考性“行业共识”。|Robots协议是互联网上的国际准则,必须严格遵守。|Robots协议是一种约定。|Robots协议告知网络爬虫哪些页面可以抓取,哪些不可以。
- 百度robots工具具有以下哪项功能() A: 实时查看网站在百度中已生效的robots文件内容 B: 支持通知百度更新网站的robot文件 C: 支持对robots文件进行语法及逻辑校验 D: 能够按照规则生成robots文件 E: 以上全都是
- robots.txt与meta robots html在使用过程中的区别,以下说法正确的是( ) A: robots.txt文件这个方式下页面会被抓取 B: robots.txt文件这个方式下页面不会被抓取 C: robots.txt文件这个方式下页面会被收录 D: meta robots html页面会被抓取但不会被索引
- 网站通过robots.txt文件可以限定网络爬虫的访问范围。
- Which of the following is the main idea of this article? A: Robots B: Uses of Robots C: Development of Robots D: Advantages of Robots