• 请不要在回答技术问题时复制粘贴 AI 生成的内容
m31271n
V2EX  ›  程序员

各位 dalao 都用什么样的服务器监控解决方案?

  •  
  •   m31271n · Jul 21, 2016 · 3605 views
    This topic created in 3614 days ago, the information mentioned may be changed or developed.

    只了解到现在比较常用的监控系统有 Graphite 和 TICK ,自己也写了个 总结 。但总感觉不对,所以特来发帖,请教各位 dalao 都是怎么做的?

    19 replies    2016-07-22 14:41:57 +08:00
    zhangfan
        1
    zhangfan  
       Jul 21, 2016
    cacti
    9hills
        2
    9hills  
       Jul 21, 2016
    现在的开源监控方案,都不是很完美,传统的就不说了,新兴的 TICK ,这个的缺点是 InfluxDB 开源版本以后只有单机版,扩展性&性能非常成问题,其他的 TCK 也比较新兴,可能需要大量的二次开发。 哦中间的 Chrograf 建议换成 Grafana

    还有 Prometheus ,这个项目还没来得及了解,看文档还可以

    此外这种完整解决方案基本没有了,都是一些零散的模块,需要大量的二次开发和整合,比如 OpenTSDB (只存储时间序列)
    knightdf
        3
    knightdf  
       Jul 21, 2016
    nagios,graphite
    m31271n
        4
    m31271n  
    OP
       Jul 21, 2016
    @9hills 确实 InfluxDB 0.11 以前还有集群设置的文档,到 0.13 就完全剔除了。马上就要发 1.0 了,希望能再次出现。感谢你的回复。
    9hills
        5
    9hills  
       Jul 21, 2016
    @m31271n 集群版用来卖钱了,开源版应该不会有了。

    需要自己在业务层做 sharding
    c0878
        6
    c0878  
       Jul 21, 2016
    直接买监控宝 自己架设太麻烦
    m31271n
        7
    m31271n  
    OP
       Jul 21, 2016
    @9hills 你所说的在业务层做 sharding ,是指 “针对某一特定部分的业务架设一个 InfluxDB ”,然后再 “针对另一部分的业务架设一个 InfluxDB ” 吗?
    daocheng
        8
    daocheng  
       Jul 21, 2016
    额。。就用的之前推广的 OneAPM, 我是低端玩家
    Tony1ee
        9
    Tony1ee  
       Jul 21, 2016 via Android
    只有我看成 dadiao 吗…
    huson
        10
    huson  
       Jul 21, 2016
    zabbix
    jhaohai
        11
    jhaohai  
       Jul 21, 2016 via iPhone
    prometheus ,搭配各种 sd
    m31271n
        12
    m31271n  
    OP
       Jul 21, 2016
    @jhaohai sd 是啥?(就俩字, 很难检索,求告知)
    jhaohai
        13
    jhaohai  
       Jul 21, 2016 via iPhone   ❤️ 1
    @m31271n 服务发现, prometheus 可以配合 consul , etcd , zookeeper 之类的工具自动获取监控目标
    mytsing520
        14
    mytsing520  
    PRO
       Jul 21, 2016
    zabbix
    shiny
        15
    shiny  
    PRO
       Jul 21, 2016   ❤️ 1
    分两块,系统运行状态的监控和应用状态的监控, APM 类以及云服务器自带的系统监控
    m31271n
        16
    m31271n  
    OP
       Jul 21, 2016
    @jhaohai 感谢。
    pc10201
        17
    pc10201  
       Jul 22, 2016
    小米的监控系统
    Ryan817
        18
    Ryan817  
       Jul 22, 2016   ❤️ 1
    open-falcon
    prometheus
    influxdb 0.12 以后的版本就是坑,弃用
    m31271n
        19
    m31271n  
    OP
       Jul 22, 2016
    @Ryan817 谢。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1186 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 55ms · UTC 17:48 · PVG 01:48 · LAX 10:48 · JFK 13:48
    ♥ Do have faith in what you're doing.