任何一条Disallow 记录为空，都说明该网站的所有部分都允许被访问。

判断题任何一条Disallow 记录为空，都说明该网站的所有部分都允许被访问。

1.判断题只要将User-agent 设为知名的用户代理，爬虫就能够成功地伪装成浏览器。

2.判断题搜素引擎爬取到的网页数据与浏览器得到的HTML 数据一定是不同的。

3.判断题已抓取URL 队列记载了爬虫系统已经下载过的网页URL ，能够避免网页的重复抓取。

4.判断题网站通过robots.txt 文件可以限定网络爬虫的访问范围。

5.判断题网络爬虫程序只能使用python 语言进行开发。

6.判断题通用网路爬虫会访问与预定主题相关的网页。

7.判断题网络爬虫是一个模拟真人浏览互联网行为的程序。

8.判断题Robots.txt协议可以限制爬虫程序采集某些网页的数据。

9.问答题什么是通用爬虫？

10.问答题什么是代理IP ？