推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
aragakiiyui
V2EX  ›  Python

乱码的♂哲学♀教育

  •  
  •   aragakiiyui · Aug 27, 2015 · 3151 views
    This topic created in 3937 days ago, the information mentioned may be changed or developed.
    我不知道岁月给我们的爱为什么是那样的苍白,它停在了今天,让我真的无奈。。。
    这是一个令人忧伤的 bug ,为什么我的爬虫爬京东的时候,同一个关键词,大部分时间都是正常运作的,但是有时候结果却是乱码,不知道是不是我代码的问题。
    我是用 XPath+requests 来解析网页的,大家写爬虫有碰到过这种情况么?!求建议!
    6 replies    2015-08-30 12:25:45 +08:00
    kurtrossel
        1
    kurtrossel  
       Aug 27, 2015   ❤️ 4
    有点乱,别人可能看不到重点,整理一下

    没有什么能阻挡那滔天的巨浪,它铺面而来,席卷了一切。。。
    那是一个慵懒倦怠的午后,忧伤的程序员突然发现了他的宿命,他与京东的纠缠。隐形的巨兽匍匐在他面前,蓄势待发,他被巨兽的鼻息笼罩,却无力挣脱
    他是一个直男,他用 XPath+requests 写爬虫解析网页,同一个关键词,有时返回的结果正常,有时却是乱码,大家是否也遇到过相同情况?有何解决办法?
    kasp
        2
    kasp  
       Aug 27, 2015
    LS 整理的真好。
    wuling
        3
    wuling  
       Aug 27, 2015
    奶茶东嘛,每爬那么 30 多次里总有个几次乱码,你懂的
    aragakiiyui
        4
    aragakiiyui  
    OP
       Aug 27, 2015
    @kurtrossel 我从未见过如此与我一般才华横溢之人(一 一+正义的眼神)。
    aragakiiyui
        5
    aragakiiyui  
    OP
       Aug 27, 2015
    @wuling 你也出现过这种情况么?!
    RadishWind
        6
    RadishWind  
       Aug 30, 2015
    换正则试试
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2678 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 10:32 · PVG 18:32 · LAX 03:32 · JFK 06:32
    ♥ Do have faith in what you're doing.