clino
V2EX  ›  问与答

怎么备份微博数据呢?

  •  
  •   clino · Oct 23, 2014 · 6359 views
    This topic created in 4246 days ago, the information mentioned may be changed or developed.
    搜了一下貌似木有好用的,像 http://app.weibo.com/detail/3P84CB?ref=samedeveloper 这个看起来不能用

    不管是工具还是网页应用都可以

    突然想起来要做备份是因为某个全网封杀...
    21 replies    2014-10-26 21:39:38 +08:00
    staticor
        1
    staticor  
       Oct 23, 2014
    第三方客户端实现的算吗? http://www.beyondcow.com/miao/
    aliuwr
        2
    aliuwr  
       Oct 23, 2014
    在 ifttt 弄个任务.
    Yvette
        3
    Yvette  
       Oct 23, 2014 via iPhone
    淘宝
    clino
        4
    clino  
    OP
       Oct 23, 2014
    @staticor 这个我木有mac...
    @aliuwr ifttt 可以备份? 配好了应该是新的能触发吧,旧的也行吗? 我比较希望备份成文件这种方式
    @Yvette ??
    dcty
        5
    dcty  
       Oct 23, 2014
    自己用微博的API拉一下数据就好了
    clino
        6
    clino  
    OP
       Oct 23, 2014
    @dcty 也对,找了一个 python 库,之后试试看: https://pypi.python.org/pypi/weibo/0.2.2
    nikolai
        7
    nikolai  
       Oct 23, 2014
    自由微博 →_→
    staticor
        8
    staticor  
       Oct 23, 2014
    这一点体现weibo和twitter的差距了

    不付费的用户只是等着被平台卖的产品.
    zouxcs
        9
    zouxcs  
       Oct 23, 2014
    还在用weibo。。。
    yakiang
        10
    yakiang  
       Oct 23, 2014   ❤️ 2
    现在的微博API已经限制了最多返回一个用户的最新2000条微博,也就是说如果你的微博数大于2000,任何第三方应用或你自己用API都没办法完整备份的。
    但我自己通过 m.weibo.cn 抓包发现一个可以抓取一个用户所有公共微博的接口(自己F12看下都能发现),通过这个接口前两周把自己8000条微博都 backup 了下来,然后用 API 批量都删了 -。-
    dailiip
        11
    dailiip  
       Oct 23, 2014
    自己微博不多,写了个简单的PHP,通过API把微博都备份了一下,然后发现以前好多转发的都被删了……
    Nourl
        12
    Nourl  
       Oct 23, 2014
    微博 --- RSS --- IFTTT --- Evernote

    几乎实时的备份,目前在用。
    20150517
        13
    20150517  
       Oct 23, 2014   ❤️ 1
    推荐一个自己写的,备份到mongo,所有数据全部备份,包括评论,图片也存下来成高清
    https://github.com/steven-shi/Wblogger
    clino
        14
    clino  
    OP
       Oct 23, 2014
    @20150517 听起来很棒阿,能不能以其他方式备份,如保存成文件?
    yakiang
        15
    yakiang  
       Oct 23, 2014
    @20150517 这个目测同样有2000条的限制吧?
    20150517
        16
    20150517  
       Oct 23, 2014 via Android
    @yakiang 一小时2k条吧还是一天的?你可以给celery一个rate,让他慢慢爬就是了
    jason52
        17
    jason52  
       Oct 23, 2014
    我用过这个

    ===

    如果不能使用请进官网下载最新版 www.dgmcu.com/sinawbbf.html

    注意:
     本软件备份微博消息不限制条数。可增量备份。
     Win7 用户要以管理员身份来运行,否则出现“无法访问”的错误。
     重要:为防止密码泄露,在公用电脑登陆时,请不要勾选“记住登陆状态”
     有些杀毒软件会误报有病毒,请设为信任后再操作,否则可能出现下载都是空白的。作者保证没有任何病毒代码或者盗取密码,输密码窗口只相当于打开一个IE。如不放心可在还没输密码前按 CTRL + N ,在弹出的新IE窗口中登录,成功后在备份软件窗口按F5刷新,就已是登录状态了。
     请勿下载色情与版权微博,否则后果自负。
     本软件完全免费,每次使用都借贵微博写一条消息替为宣传(每天最多一条),恳请各位用户手下留情勿于删除,因使用者多了作者才会花更多精力去完善此软件。谢谢!
     XP用户如出现如下错误,说明本机没有.Net Framework2.0 sp2 或以上的运行库,可到http://dl.pconline.com.cn/html_2/1/82/id=10637&pn=0.html下载安装。

    不想重新发明轮子了
    jason52
        18
    jason52  
       Oct 23, 2014
    抓过caoz的所有微博


    tk的


    20150517
        19
    20150517  
       Oct 23, 2014 via Android
    @clino 你fork个把我写mongo的改成写文件就是了,因为是结构化的数据,所以我写mongo方便以后再读取
    jason52
        20
    jason52  
       Oct 23, 2014
    虽然感觉很low,但是他真的work。
    icedx
        21
    icedx  
       Oct 26, 2014
    @jason52 好文共勉区的太吓人了...
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1358 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 66ms · UTC 17:10 · PVG 01:10 · LAX 10:10 · JFK 13:10
    ♥ Do have faith in what you're doing.