noobpythoner 最近的时间轴更新
noobpythoner

noobpythoner

V2EX 第 229286 号会员,加入于 2017-05-05 18:55:40 +08:00
  •   指定的图片不存在
    noobpythoner 最近回复了
    2017 年 6 月 8 日
    回复了 gap 创建的主题 Python Python 程序员的是被称为 Pythonista 吗?还是 Pythoner?
    oh,糟了
    2017 年 6 月 8 日
    回复了 Yingruoyuan 创建的主题 Python scrapy 下载图片到 4w 张左右总是会卡住
    可以使用 scrapy_redis 来完成,所有的去重都是通过 redis 来完成的,还能够做到状态保持,如果需要可以实现分布式,redis 的内容类似下面,
    redis > keys *
    1) "***:dupefilter"
    2) "***:items"
    3) "***:requests"

    或者可以迭代的读取数据库的内容,下一次请求之前从内存中删除上一次的请求地址,类似 https://www.ibm.com/developerworks/cn/xml/x-hiperfparse/
    这个方法我自己没有试过,但是应该是可行的
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1411 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 15ms · UTC 17:09 · PVG 01:09 · LAX 10:09 · JFK 13:09
    ♥ Do have faith in what you're doing.