亚马逊云服务全球大瘫痪,15 小时宕机席卷数百万用户!
一次 DNS 解析故障,引发全球互联网服务雪崩,亚马逊 AWS 再次暴露云时代的 “阿喀琉斯之踵”。美国东部时间 10 月 20 日凌晨 3 点,当大多数人还在睡梦中,一场席卷全球的互联网风暴悄然开始。亚马逊旗下云计算服务平台 AWS 突发大规模故障,导致全球数百万用户报告故障,从迪士尼 + 到麦当劳,从英国政府网站到纽约时报,众多知名网站和应用陷入瘫痪。这场持续约 15 小时的服务中断,再次敲响了全球数字化基础设施脆弱性的警钟。
01 故障全貌:一次 DNS 引发的全球互联网雪崩
亚马逊 AWS 此次故障始于美国东部时间 10 月 20 日凌晨 3 点左右,最初表现为美国东部地区的多项 AWS 服务出现错误率上升和延迟增加。根据亚马逊官方通报,故障根源在于其域名系统出现故障。DNS 作为互联网的 “导航系统”,负责将网址转换为 IP 地址,是网站和应用程序能在联网设备上加载的关键环节,一旦出现异常,就如同全球 GPS 系统突然失灵,用户无法正常访问网络服务。AWS 的 US-EAST-1 区域(位于弗吉尼亚州北部)成为故障震中,该区域是 AWS 核心运算中心之一,承载着大量云端应用与网站流量,故障迅速蔓延,最终影响了 AWS 自身超过 70 项服务,形成了一场波及全球的互联网瘫痪事件。
02 影响范围:从流媒体到银行,无一幸免
亚马逊 AWS 的这次故障造成了连锁反应,影响了各行各业的大量网络服务。在娱乐领域,迪士尼 +、亚马逊视频服务及语音助手均出现问题,众多游戏玩家在社交平台上抱怨云游戏平台 Roblox 与 Fortnite 无法正常运作。在金融服务方面,情况更为严峻,加密货币交易平台 Coinbase 表示,许多用户因故障无法使用服务,股票交易平台罗宾汉和支付服务 Venmo 也同样受到冲击。最令人担忧的是英国银行系统的大范围异常,英国劳埃德银行确认,该银行及旗下的哈利法克斯银行和苏格兰银行部分线上和支付服务出现中断,甚至连英国税务及海关总署也发布声明,确认其在线服务因 AWS 故障而受到影响。
03 应急响应:多路径并行抢修,15 小时基本恢复
面对突如其来的大规模故障,亚马逊 AWS 迅速启动应急机制。AWS 在故障发生后立即表示,正通过 “多路径并行方案全力加速恢复服务”,这种多线并进的修复策略,旨在从不同角度同时解决故障,缩短恢复时间。经过紧张抢修,AWS 在美东时间 20 日凌晨 6 时(北京时间 20 日晚上 6 时)宣布受影响服务正在恢复,整个故障持续约 15 小时,直至纽约时间下午 6 时左右,AWS 服务才基本恢复正常运行。亚马逊旗下服务健康仪表板更新显示,其服务已 “恢复正常运行”,然而,这场长达 15 小时的中断,对全球数字经济造成的损失已无法挽回。
04 历史对比:AWS 故障频发,云服务可靠性受疑
这并非 AWS 首次引发大面积瘫痪,回顾历史,类似的故障屡见不鲜。2023 年 6 月 13 日,AWS 宕机持续近 4 小时,美东区域多个服务受到中断;2021 年 12 月 7 日,AWS 其中一个数据中心遭遇故障,导致服务中断长达 5 小时,包括航空公司、汽车经销商、支付应用程序以及视频服务等都受到严重影响。与此次故障相比,之前的几次中断持续时间相对较短,但同样造成了广泛影响。频繁的故障引发业界对云服务集中化风险的深刻反思,巴斯大学信息技术教授詹姆斯・达文波特对此评论道,银行系统应更多依托英国或欧洲本地的数据基础设施,以降低外部依赖带来的安全隐患。#亚马逊#
http://50061.net/xinwendongtai/732190.html
