我建了两个网站,没有任何被任何博客添加友链,没有在任何网站上留下过 url ,但是我都在这两个服务器里的 access.log 里看到了谷歌爬虫(虽然我设置了 robots.txt 不让爬取)。难不成是靠遍历 ip 地址吗?
我建了两个网站,没有任何被任何博客添加友链,没有在任何网站上留下过 url ,但是我都在这两个服务器里的 access.log 里看到了谷歌爬虫(虽然我设置了 robots.txt 不让爬取)。难不成是靠遍历 ip 地址吗?
1
xzem Nov 17, 2016
比如说 chrome
|
2
DesignerSkyline Nov 17, 2016 via iPad
Google chrome 的安全检测服务可能会导致这个现象
|
3
yankebupt Nov 17, 2016 via Android
爬的时候不遵循 robots.txt 的也有可能是伪造成谷歌爬虫的其他爬虫,比如安全机构
|
4
yushiro Nov 17, 2016 via iPhone
网站有域名,根据域名注册商的列表爬。
|
5
syahd OP @DesignerSkyline 什么意思?
|
7
DesignerSkyline Nov 17, 2016
@whwq2012 safebrowsing probes
|
11
flynaj Dec 15, 2016 via Android
看 ip 地址,如果不是 google 的服务器就是伪造的,可能是扫描
|