相信Spider用来收集信息已经是常态了吧? @binux 的 pyspider 成了日常收集信息的利器,但是也有了很多的问题
1、不断有各种JS、Cookie计算token来防止抓取,当然访问频次这个没有办法,只能不断地增加代理用的IP吧
2、Chrome的App已经足够强大
基于上述的两点,我想,是不是有一种基于Chrome的Spider,App形式,直接在Chrome里面搞定各种信息的抓取
有这样的App么?如果没有,来挖个坑如何?
1、不断有各种JS、Cookie计算token来防止抓取,当然访问频次这个没有办法,只能不断地增加代理用的IP吧
2、Chrome的App已经足够强大
基于上述的两点,我想,是不是有一种基于Chrome的Spider,App形式,直接在Chrome里面搞定各种信息的抓取
有这样的App么?如果没有,来挖个坑如何?