ATiGr
V2EX  ›  问与答

学爬虫技术应该如何开始?

  •  
  •   ATiGr · Feb 1, 2015 · 5292 views
    This topic created in 4149 days ago, the information mentioned may be changed or developed.

    有感于爬虫技术的威力 (/t/164359) 我深深地觉得,这是个强有力的工具!所以特别想拥有这样的Super Power。哪怕学习需要的时间久一点,要看很多书也没关系。

    我非计算机专业,有的只是十足的兴趣,和一些系统使用方面的知识,对 Linux ,仅仅懂得一些最最基本的命令行操作,但是也没怎么用过。所以,可能需要各位前辈从基础方向开始指导一个方向。需要补的框架知识是什么,最好有一个针对性的书目推荐啥的~

    如能得到前辈们的一些指导,定能少绕很多弯路,在此先行谢过!

    9 replies    2015-02-02 14:02:56 +08:00
    Eymard
        1
    Eymard  
       Feb 1, 2015
    head first系列 随便看看先有个概念
    muziyue
        4
    muziyue  
       Feb 2, 2015
    html+http协议+python 这个应该最简单了
    justjavac
        5
    justjavac  
       Feb 2, 2015
    mhycy
        6
    mhycy  
       Feb 2, 2015
    把python的第三方包 requests 学会就算入门了
    phoeagon
        7
    phoeagon  
       Feb 2, 2015
    从认识到不要自己写爬虫开始。
    em70
        8
    em70  
       Feb 2, 2015 via Android
    先写个最简单的,然后不断完善,抓豆瓣吧
    wizardforcel
        9
    wizardforcel  
       Feb 2, 2015
    你先看curl和regex就好。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2495 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 49ms · UTC 15:58 · PVG 23:58 · LAX 08:58 · JFK 11:58
    ♥ Do have faith in what you're doing.