superhxnju
V2EX  ›  问与答

好奇有多少公司是支持机房/AZ 级容灾的?

  •  
  •   superhxnju · Mar 6, 2024 · 1340 views
    This topic created in 825 days ago, the information mentioned may be changed or developed.
    在这个帖子里面看到有讨论多副本支持 AZ 容灾的事情 https://www.v2ex.com/t/1021131

    好奇有多少公司是支持“真”机房/AZ 级容灾的?

    个人理解如果是真正的实现容灾那么至上而下要能容灾:
    1. 首先业务和基础设置部署上需要多 AZ 部署;
    2. 然后在线业务依赖的数据库、带存储类的中间件(消息、缓存)需要有 AZ 容灾能力(如果只是切流,那不算“真“容灾,数据也需要保证完整性的);
    3. 还有离线大数据的批处理等也要跨 AZ 部署;
    4. 最后还要能监测到 AZ 故障,整体南北流量进行切流;

    感觉还是挺难的,所以大家的 AZ 级容灾是咋做的,真的可以把一个 AZ 永久性的灾难,然后业务可用性和数据也不受损么?
    3 replies    2024-03-06 19:10:53 +08:00
    egen
        1
    egen  
       Mar 6, 2024
    没那么容易做的,参考当年的支付宝机房光纤被挖断导致业务中断事件
    killva4624
        2
    killva4624  
       Mar 6, 2024
    大部分逻辑组件或者边缘接入都是很好做到 AZ or 机房容灾的。
    真正难的是核心数据层,又要考虑数据一致性,又要考虑迁移成本和速度;还有日常演习的难度,不可能做到和逻辑层同样的容灾能力和 MTTR ,无非是在衡量成本、人力和可执行层面上综合评估,做一个平衡的方案。
    当然金融类平台也许真的有那么大的成本和精力投入去做,希望其他朋友能给出好的例子。
    superhxnju
        3
    superhxnju  
    OP
       Mar 6, 2024
    @killva4624 是的,数据层跨 AZ 复制后延时至少再增加 1 ms ,不知道各个业务会为了 AZ 容灾付出多大的代价。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5148 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 77ms · UTC 09:24 · PVG 17:24 · LAX 02:24 · JFK 05:24
    ♥ Do have faith in what you're doing.