如题,5 刀 2c 1g 的版本,apt 安装 mysql 过程中 ssh 无响应,再次连接 ssh 显示超时,aws 控制面板显示 cpu 占用达到了 60-70%。
推测是内存不足导致死机并不断 swap 。尝试强制重启,发现在开机的短暂几秒 ssh 可以连接,随即再次死机,猜测是 mysql 的 systemd 服务再次占满了资源,于是强制重启后立即在命令行执行ssh xxx "sudo systemctl disable mysql",问题解决。
但是有几点疑惑:
- 为什么系统没能通过 oom killer 杀死 mysql 进程来保证系统的正常运行
- 查日志(
grep "Out of memory" /var/log/syslog)发现 oom killer 有杀死 mysql 进程的记录,但是似乎 oom killer 并没有正常运行,因为我在一个小时的时间内将机器重启了数次,但日志中只有短暂时间内的几次执行日志。为什么?
日志如下
Jul 5 13:22:55 ip-172-26-8-175 kernel: [ 148.707689] Out of memory: Killed process 2343 (mysqld) total-vm:267308kB, anon-rss:169216kB, file-rss:2304kB, shmem-rss:0kB, UID:116 pgtables:488kB oom_score_adj:0
Jul 5 13:24:07 ip-172-26-8-175 kernel: [ 220.640053] Out of memory: Killed process 2358 (mysqld) total-vm:292680kB, anon-rss:193792kB, file-rss:2304kB, shmem-rss:0kB, UID:116 pgtables:540kB oom_score_adj:0
Jul 5 13:25:03 ip-172-26-8-175 kernel: [ 276.520345] Out of memory: Killed process 2402 (mysqld) total-vm:299300kB, anon-rss:197504kB, file-rss:2432kB, shmem-rss:0kB, UID:116 pgtables:552kB oom_score_adj:0
Jul 5 13:25:05 ip-172-26-8-175 kernel: [ 278.284818] Out of memory: Killed process 2463 (mysqld) total-vm:329788kB, anon-rss:231552kB, file-rss:2304kB, shmem-rss:0kB, UID:0 pgtables:612kB oom_score_adj:0
