V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
2232588429
V2EX  ›  Python

新手想请教一下,想用 python 在服务器上搭建一个爬虫页面来爬取指定网站的新闻资讯,这个在网上有哪些比较合适的教程可以参考的?谢谢!

  •  
  •   2232588429 · Sep 30, 2014 · 5276 views
    This topic created in 4232 days ago, the information mentioned may be changed or developed.
    以前使用过这样的页面,就是按照时间刷新新闻标题列表,然后点击标题就可以进入别人的网站阅读内容。想请大家帮忙推荐一下这方面比较合适的教程。
    5 replies    2014-10-02 22:01:02 +08:00
    zxcsf
        1
    zxcsf  
       Sep 30, 2014   ❤️ 1
    fxbird
        2
    fxbird  
       Sep 30, 2014
    这玩意儿居然都出中文文档了,很强么?
    orzfly
        3
    orzfly  
       Sep 30, 2014
    pyspider 也是个好东西 =。=
    https://github.com/binux/pyspider
    brickgao
        4
    brickgao  
       Oct 2, 2014
    处理新闻有一个叫 newspaper 的包

    http://newspaper.readthedocs.org/en/latest/
    R4rvZ6agNVWr56V0
        5
    R4rvZ6agNVWr56V0  
       Oct 2, 2014
    scrapy 足以
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2511 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 46ms · UTC 06:37 · PVG 14:37 · LAX 23:37 · JFK 02:37
    ♥ Do have faith in what you're doing.