oldcai
0.01D
V2EX  ›  服务器

请问什么监控可以反映服务器一天内哪个/组进程占用 CPU/磁盘/内存等资源最多

  •  
  •   oldcai ·
    PRO
    · Jul 10, 2017 · 3851 views
    This topic created in 3257 days ago, the information mentioned may be changed or developed.

    我所知道的精细到每个进程的监控都仅仅反映实时情况;

    而可以看到历史数据的都只有综合的图表,没有细分到进程、用户的,比如整个机器的 CPU/内存 /磁盘读写使用情况。

    所以想请教一下,想可回溯地统计精细到进程、用户等的信息怎么做到。

    9 replies    2017-07-12 11:04:41 +08:00
    hadoop
        1
    hadoop  
       Jul 10, 2017 via Android   ❤️ 1
    进程级流量监控没看到比较好的
    ldbC5uTBj11yaeh5
        2
    ldbC5uTBj11yaeh5  
       Jul 10, 2017 via Android   ❤️ 1
    我用 Prometheus 和 granfana 做过,自己写 exporter 而已,不难。

    cpu 内存磁盘最容易。其中 tcp 流量监控复杂一些,要用内核的新一些的特性才比较容易做。
    ldbC5uTBj11yaeh5
        3
    ldbC5uTBj11yaeh5  
       Jul 10, 2017 via Android
    哦,忘了说,据我所知,市面上没有现成开源的,所以我才自己弄的。
    hadoop
        4
    hadoop  
       Jul 10, 2017 via Android
    @jigloo tcp 流量监控能到进程级别吗
    ldbC5uTBj11yaeh5
        5
    ldbC5uTBj11yaeh5  
       Jul 10, 2017   ❤️ 1
    @hadoop 嗯,用的是 tcp_info 这个结构,原理和 netflix tcptop 差不多。不是非常准确,但是够用了。
    ldbC5uTBj11yaeh5
        6
    ldbC5uTBj11yaeh5  
       Jul 10, 2017
    也许我那天可以问上面,是否可以把这个 exporter 开源,也算解决痛点填补空白了。
    ldbC5uTBj11yaeh5
        7
    ldbC5uTBj11yaeh5  
       Jul 10, 2017   ❤️ 1
    哦,还有变通的一招。

    把进程容器化,然后用 cadvisor。(这货非常吃 CPU 慎用)
    rswl
        8
    rswl  
       Jul 10, 2017   ❤️ 1
    grafana + influxdb + telegraf
    QQ2171775959
        9
    QQ2171775959  
       Jul 12, 2017
    专业的工具还是有蛮多的嘛。。。老兄多去试一下。。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3190 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 37ms · UTC 11:27 · PVG 19:27 · LAX 04:27 · JFK 07:27
    ♥ Do have faith in what you're doing.