• 请不要在回答技术问题时复制粘贴 AI 生成的内容
briefcopy
V2EX  ›  程序员

开源 JAVA 爬虫,WebCollector,具有可扩展内核和爬虫基本类库,提供了一个界面。欢迎吐槽。

  •  
  •   briefcopy · Jul 21, 2014 · 6308 views
    This topic created in 4338 days ago, the information mentioned may be changed or developed.
    5 replies    2014-07-27 12:23:59 +08:00
    gongweixin
        1
    gongweixin  
       Jul 21, 2014   ❤️ 1
    粗略的扫了一眼,不能爬特定文件?比如图片,歌曲一类的,只能爬页面?
    briefcopy
        2
    briefcopy  
    OP
       Jul 21, 2014
    @gongweixin 什么都能爬,里面默认的那个demo,如果你爬合肥工业大学官网,里面所有的flv、图片、CSS、JS都会搞下来的。
    briefcopy
        3
    briefcopy  
    OP
       Jul 21, 2014
    @gongweixin 请问您是想要什么样的需求?
    gongweixin
        4
    gongweixin  
       Jul 23, 2014
    我的意思是只爬图片,歌曲,别的都不要. 只爬特定文件.
    briefcopy
        5
    briefcopy  
    OP
       Jul 27, 2014
    @gongweixin 没有问题,设定一下正则就OK
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2819 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 13:22 · PVG 21:22 · LAX 06:22 · JFK 09:22
    ♥ Do have faith in what you're doing.