应用服务信息:
项目拆分为七个服务,每台服务器上都会部署这七个服务
其中一个服务(简称 api 服务)作为用户请求入口,通过 dubbo 对另外六个服务进行调用
问题:
项目常态下接口平均响应时间 90ms 左右, 运行一段时间后(目前是约一天左右), 会出现部分机器上的 api 服务调用 dubbo 服务耗时增长, 直至无法在超时时间内响应(超时时间配置的是 30 秒), 引起崩溃。(注:不是四台机器上的 api 调用 dubbo 服务都会超时, 其中 1 ~ 2 台, 每次崩溃的机器也不一样)
崩溃时服务器 cpu, 内存, 带宽出入均正常。
数据库 cpu, 内存, 连接数正常,没有慢查询。
dubbo 监控图显示 provider 耗时正常, consumer 耗时很高
用了无数种办法,依旧不能确定.