前些日子我有个私人项目需要用到验证码识别,自己本身没有经验,于是找了些开源项目的代码试用,成功率还不错,但验证码在请求频率方面也有限制,也就是说需要写不少异常处理,没经验很难估算需要投入的精力和时间。
转念一想,我这采集数据也不是一百几十万,也就一万几千而已,对实时性也没高要求,折腾那么多干嘛。简单点,让事情简单点。
我干脆把几个地方的验证码统一接入到一个页面,就放在本地树莓派,我每天摸鱼啊想放松脑子啊,就打开这个页面机械地输入验证码,不停重复着人肉打码,如果遇到限制了就重新拨号换 IP。
你别说,还挺有意思的。每次打码更新数据就像进行一种仪式,令我对更新的数据有别样的感情,以前在后台采集的数据我说删就删,如今采集的数据我分外珍惜。
看到这里你是不少以为我要说我的公众号是多少多少了,并没有,这个账号还没发过贴,纯粹为了水一贴。
转念一想,我这采集数据也不是一百几十万,也就一万几千而已,对实时性也没高要求,折腾那么多干嘛。简单点,让事情简单点。
我干脆把几个地方的验证码统一接入到一个页面,就放在本地树莓派,我每天摸鱼啊想放松脑子啊,就打开这个页面机械地输入验证码,不停重复着人肉打码,如果遇到限制了就重新拨号换 IP。
你别说,还挺有意思的。每次打码更新数据就像进行一种仪式,令我对更新的数据有别样的感情,以前在后台采集的数据我说删就删,如今采集的数据我分外珍惜。
看到这里你是不少以为我要说我的公众号是多少多少了,并没有,这个账号还没发过贴,纯粹为了水一贴。