• 请不要在回答技术问题时复制粘贴 AI 生成的内容
NaVient
V2EX  ›  程序员

关于服务器信息收集的一些小问题

  •  
  •   NaVient · Mar 9, 2018 · 3900 views
    This topic created in 3014 days ago, the information mentioned may be changed or developed.

    目前有 100 台阿里云服务器的机器的信息需要监控 我的想法是使用 Python 获取到服务器的信息然后,在服务端通过 socket 获取. 但是因为服务器数量比较多的原因,不知道时效性能不能保证. 自己不是做运维的对这方面没什么经验,想请教各位大牛这种需求的最佳实践是什么?

    11 replies    2018-03-09 22:29:40 +08:00
    Immortal
        1
    Immortal  
       Mar 9, 2018
    有成熟的开源监控方案 为啥要自己造轮子
    我不是做运维的
    yunlzheng
        2
    yunlzheng  
       Mar 9, 2018
    搭一套 Promethues,轻松搞定
    nicolas0caser
        3
    nicolas0caser  
       Mar 9, 2018
    如果是服务器基础设施监控无非以下几个指标:内存、cpu、磁盘(占用、IO )、网络 IO 等,无论是自己写 Python 脚本实现或者使用成熟的开源的软件都可以的。我司目前服务器 70 台左右,使用 telegraf+influxdb+grafana:telegraf 做 agent 收集服务器基础数据,发送到 influxdb,grafana 做前端展示,基本符合需求了。当然也存在单点故障的问题,再就是 influxdb 隔断时间会异常退出,有点蛋疼。
    iappled
        4
    iappled  
       Mar 9, 2018
    Promethues
    dreampython
        5
    dreampython  
       Mar 9, 2018 via iPhone
    搜下 zabbix 等开源监控系统是不是你需要的
    likexian
        6
    likexian  
       Mar 9, 2018
    https://github.com/likexian/stathub-go 要简单就这个(好久没更新了,新版本难产中)
    Vogan
        7
    Vogan  
       Mar 9, 2018
    推荐 zabbix

    支持自定义设置阈值报警
    支持自定义监控项
    支持 api
    ...
    awhane
        8
    awhane  
       Mar 9, 2018
    同推荐 Prometheus。。。很简单了。
    貌似不提供 aliyun 的 SD,可以用 file_sd..
    ywgx
        9
    ywgx  
       Mar 9, 2018
    安利下 https://xabcloud.com 你需要
    opengps
        10
    opengps  
       Mar 9, 2018
    应该可以直接使用阿里云的接口吧
    popoer
        11
    popoer  
       Mar 9, 2018
    直接用阿里云监控有什么问题吗?还有免费的短信提醒
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3270 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 45ms · UTC 12:34 · PVG 20:34 · LAX 05:34 · JFK 08:34
    ♥ Do have faith in what you're doing.