V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
JamesWone
V2EX  ›  成都

亲爱的 v2ex,我要向你道歉。

  •  
  •   JamesWone · Dec 31, 2015 · 6215 views
    This topic created in 3770 days ago, the information mentioned may be changed or developed.

    昨日下午三点半左右,你们运维肯定检测到了一股来自成都某地的异常 IP 。
    额,没错那是我干的~

    事情是这样滴,前两天闲着没事又无聊~然后我就尝试着自己写了个多线程爬虫框架...两天功夫,就写完了...写完了得测试啊...然后我就寻思着写了个 DEMO...

    额,就是这个啦...https://github.com/JamesWone/Spy

    然后今天我想再测试的时候,整死跑不出东西...我还以为我代码有问题呢...于是重构..再跑..再重构..再跑~要抓狂了有木有....
    难道是我 ip 被小黑屋了?打开 Chrome....果然被"Acceess Denied"了....

    oh~mygod~我完全不是故意的啦~一股罪恶感犹然而上心头~希望 V2EX 不要封我的号啦~毕竟这是我的处女贴啊~QAQ

    额~事情就是酱紫...

    PS:你们运维反应真快,为 V2EX 点个赞~

    27 replies    2016-01-06 02:57:54 +08:00
    Liang
        1
    Liang  
       Dec 31, 2015
    大大已报警了。。。看看你最近是否有快递
    Ellison
        2
    Ellison  
       Dec 31, 2015
    然而...你多 F5 试试...
    JamesWone
        3
    JamesWone  
    OP
       Dec 31, 2015
    @Liang 大哥我胆子小~不要吓我~
    Slienc7
        4
    Slienc7  
       Dec 31, 2015
    后台程序自动封的,访问频率过高自动屏蔽对应 IP ,这种应该还不需要人工操作,安心。
    JamesWone
        5
    JamesWone  
    OP
       Dec 31, 2015
    @xgowex V2EX 昨天都是可以爬的,明显今天才加的反爬虫措施。
    sandideas
        6
    sandideas  
       Dec 31, 2015
    自动封的。。
    我记得以前弄自动签到的时候有个错误没想出为什么
    多弄了几次就被封了三天
    warlock
        7
    warlock  
       Dec 31, 2015
    spy.go 49 行 for w.resp == nil {} 这不会死循环吗?
    Slienc7
        8
    Slienc7  
       Dec 31, 2015
    @JamesWone 几年前就有了。
    JamesWone
        9
    JamesWone  
    OP
       Dec 31, 2015
    @warlock 那个 for{}是为了起阻塞的作用,因为不确定 goroutine 是否已经执行完毕。
    justjavac
        10
    justjavac  
       Dec 31, 2015
    如何看待知乎又挂了?
    justjavac
        11
    justjavac  
       Dec 31, 2015
    靠,发错地方了。 https://www.v2ex.com/t/247465
    JamesWone
        12
    JamesWone  
    OP
       Dec 31, 2015
    @justjavac 我用 PHP 有写过一个知乎爬虫,然后当天下午知乎就挂了,那一夜我彻夜难眠....
    justjavac
        13
    justjavac  
       Dec 31, 2015   ❤️ 2
    @JamesWone 之前我用 C 语言写过一个 hello world ,结果那天晚上汶川地震了,那一夜我彻夜难眠....
    warlock
        14
    warlock  
       Dec 31, 2015
    @JamesWone
    1 、 golang 的包名 似乎应该小写
    2 、我感觉那里不需要你自己阻塞
    3 、死循环也叫阻塞?
    mystryl
        15
    mystryl  
       Dec 31, 2015
    我三脚猫的功夫写了一个脚本爬限制 ip 的收费资讯网站 5 分钟一次
    跑了 3 个月了。。。。期间客服问过我一次干嘛的,我说我挂了个自动刷新
    然后就没事了。。
    imn1
        16
    imn1  
       Dec 31, 2015
    @justjavac
    还是你厉害!!!
    usb
        17
    usb  
       Dec 31, 2015
    @justjavac 23333
    lxjsmdc
        18
    lxjsmdc  
       Dec 31, 2015
    我每天都 Acceess Denied 几次
    等 10 分钟过后就行了

    因为我习惯每次打开 N 个帖子再浏览
    JamesWone
        19
    JamesWone  
    OP
       Dec 31, 2015
    @warlock 关于阻塞这个是版本遗留问题了,因为第一版的时候 Spy 句柄是可以在 Filter 中动态的异步回调的,第二版然后就去掉了异步回调改成了 Spy.Sub()同步回调,这样其实这个 for{}就没有必要了,多谢你的提醒哦,我会更进的。
    JamesWone
        20
    JamesWone  
    OP
       Dec 31, 2015
    @justjavac 纠正一下,汶川地震是下午....
    angryRabbit
        21
    angryRabbit  
       Dec 31, 2015
    我觉得你这不叫爬虫,叫静态网站生成器。。。
    JamesWone
        22
    JamesWone  
    OP
       Dec 31, 2015
    @angryRabbit 233333....
    yeyeye
        23
    yeyeye  
       Dec 31, 2015
    楼主你好 我们强大的运维告诉你 你的 IP 被自动封禁了 我们的运作并没有受到影响 我们甚至根本就没关注到你的行为 你就被系统干掉了……
    cz208209
        24
    cz208209  
       Dec 31, 2015
    '我要进去了'
    ‘快点’
    ‘我进去了’
    ‘快点’
    ‘我弄疼你了’
    ‘你 TM 的到底进不进去’
    46fo
        25
    46fo  
       Dec 31, 2015
    @lxjsmdc 握下手
    zjqzxc
        26
    zjqzxc  
       Jan 2, 2016
    用 surface 的时候从来没 Acceess Denied 过。。
    用台式机经常 Acceess Denied ,,然后就得开全局代理先凑合一下。。
    (都是正常使用)
    一直没想明白为啥(都是 chrome 而且已登陆,插件会自动同步)
    dbdd
        27
    dbdd  
       Jan 6, 2016
    看得我胃里一阵翻腾,还好没吃晚饭
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5448 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 69ms · UTC 05:55 · PVG 13:55 · LAX 22:55 · JFK 01:55
    ♥ Do have faith in what you're doing.