推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
Merlini
V2EX  ›  Python

python 爬取的数据要如何展现(可视化)?

  •  1
     
  •   Merlini · Aug 2, 2016 · 8266 views
    This topic created in 3595 days ago, the information mentioned may be changed or developed.

    最近无聊去熊猫 tv 直播了一小会,写了个爬虫,爬取主播 id 和竹子数量进行排序啥的看看。
    然后爬取的数据不知道怎么展现,以前都是放在本地自己看看。
    现在暂时把 python 脚本放在学生主机上了,每天 8pm 爬取一次,保存为 csv 格式。
    那么问题来了,这些数据如何展示出来了?我暂时有几个想法:

    1. csv 直接变成 html 表格
    2. 使用类似 jinja2 之类的模板
    3. 将数据存储起来,用 js 处理,正好做个网站(本人学了一丢丢前端知识)为什么要用 js 处理呢,因为感觉加上 h5 和 css3 ,数据展示效果应该会很棒比较酷炫。就是不知道 js 处理数据能力怎么样,但是其实我这边数据也很少

    github 地址: panda-bamboos-rank

    代码写的很入门级,希望大家多多发表意见

    25 replies    2016-08-06 23:27:06 +08:00
    raycool
        1
    raycool  
       Aug 2, 2016   ❤️ 1
    highchart
    StJames
        2
    StJames  
       Aug 2, 2016   ❤️ 1
    ECharts
    Merlini
        3
    Merlini  
    OP
       Aug 2, 2016
    @raycool
    @ranjiayu
    能具体讲讲这些东西吗 都是 js 生成的 charts ?
    那既然用 js 的话,我怎么把 python 的这些数据传给 js 呢
    hustlike
        4
    hustlike  
       Aug 2, 2016
    splunk 免费版
    lxy
        5
    lxy  
       Aug 2, 2016   ❤️ 1
    我自己用 Flask 搭了个 web app ,写好前端,返回整理好的数据 json 即可,连模板都没用上。
    Perry
        6
    Perry  
       Aug 2, 2016   ❤️ 1
    Merlini
        7
    Merlini  
    OP
       Aug 3, 2016 via Android
    @Perry 请问我是需要先把数据存到数据库,再用 js 读取?
    zhouxuchen
        8
    zhouxuchen  
       Aug 3, 2016 via iPhone   ❤️ 1
    还是放在数据库比较靠谱……接口的话用 Flask 就行,然后用 js 请求下
    namco1992
        9
    namco1992  
       Aug 3, 2016   ❤️ 3
    我是把数据放在 mongodb ,然后单独一个脚本作分析,导出 json ,用 c3.js 画图,然后随便写个很简单的页面就好了。
    展示在这里: http://107.170.207.236/job_analysis
    代码在这里: https://github.com/namco1992/job_analysis
    Perry
        10
    Perry  
       Aug 3, 2016 via iPhone   ❤️ 1
    @Merlini 一般把数据存在数据库,然后像楼上一样把分析出来的结果导出来(比如 json )用来展示,因此展示的时候不需要连接数据库。
    Merlini
        11
    Merlini  
    OP
       Aug 3, 2016 via Android
    @zhouxuchen @namco1992 @Perry 非常感谢 我研究研究
    aitaii
        12
    aitaii  
       Aug 3, 2016
    @Merlini highchart,ECharts 数据格式应该是 json 的。
    oraant
        13
    oraant  
       Aug 3, 2016   ❤️ 2
    最简单的当然是 excel 绘图。。
    然后是 echarts , google 图表之类的在线生成图片的。
    这些都适合小白。

    正确的姿势,是存到数据库中,然后通过 JSON 传递给 js 组件,如大家提到的 Echarts , HighCharts

    Echarts 和 Highchart 上手都很简单,有点 js 基础,就可以 5 分钟入门。
    D3 之类的学习曲线太陡。
    还有其他的一堆图表绘制插件,搜一下就是了。
    lzgbeyong
        14
    lzgbeyong  
       Aug 3, 2016
    正好最近用 node 爬虫爬取了各个直播网站的 dota 信息,直接用网站显示,这是网站 http://120.76.29.108:8080/
    只显示数据可以用 python 的 matplot 绘制表格。
    slysly759
        15
    slysly759  
       Aug 3, 2016
    @namco1992 前端生成的界面好棒啊
    Merlini
        16
    Merlini  
    OP
       Aug 3, 2016 via Android
    @namco1992 请问 mongodb 和 mysql 这两种不同类型的数据库 如何选择呢
    dabpop139
        17
    dabpop139  
       Aug 3, 2016
    有个小问题想请教,已经在你 Github 项目上提 Issue
    20150517
        18
    20150517  
       Aug 3, 2016   ❤️ 1
    Highchart + 1
    我不是前端的,但也用 django + highchart 做了不少,感觉很简单
    另外如果只是自己看的,我一般 ipython notebook 的 plot 直接显示了

    或者如果是实时数据,我还喜欢用 carbon+graphite 直接显示出来,我用十几个 graph 监控金融市场数据,用 graphite 显示的
    Merlini
        19
    Merlini  
    OP
       Aug 3, 2016
    @dabpop139 已回复
    Merlini
        20
    Merlini  
    OP
       Aug 3, 2016
    @20150517 准备用 echarts 还是中文看着爽。。
    20150517
        21
    20150517  
       Aug 3, 2016 via Android
    @Merlini 嗯 刚看了 echarts 也不错
    namco1992
        22
    namco1992  
       Aug 3, 2016
    @slysly759 就是 c3.js 啊,说 d3 学习曲线陡峭的可以尝试一下,我这种前端一窍不通的都能写,这种比较基础的图表很简单啊,数据组织好了就只剩下调调参数而已了。
    namco1992
        23
    namco1992  
       Aug 3, 2016   ❤️ 1
    @Merlini 关系型数据库偏重结构化的数据, mysql 对 json 的支持也是 5.7 加入的,估计很多人还没用上吧。而爬取的数据很难结构化,并且多变,又用不到关系型数据库的那些强项,使用文档型的 nosql 存储比较合适。而且 mongodb 应该算是 nosql 里面最像 mysql 的了,有索引,查询方便。

    综上原因,所以选择了 mongodb 。
    coreki
        24
    coreki  
       Aug 6, 2016 via iPhone
    我也在用 scrapy 写爬虫玩,打算用 mongodb 存数据,用 flask 和 js 的图形控件可视化
    Merlini
        25
    Merlini  
    OP
       Aug 6, 2016 via Android
    @coreki 你是准备本地爬取存储分析 然后上传数据么 我在纠结要不要给服务器搞个数据库 又怕吃不消
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2928 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 83ms · UTC 13:47 · PVG 21:47 · LAX 06:47 · JFK 09:47
    ♥ Do have faith in what you're doing.