亚马逊(AMZN)(AMZN.US)旗下的云计算(885362)部门周四报告称,其位于弗吉尼亚州北部的一个数据中心可用区发生故障。与此同时,衍生品交易所芝商所(CME)和加密货币交易所Coinbase均表示其交易平台出现问题。
目前尚不清楚AWS和CME的问题是否相关。然而,Coinbase表示其平台出现的问题是由AWS故障引起的。
AWS表示,故障源于单个数据中心内部温度升高。随着额外的冷却系统容量上线,目前已观察到初步的恢复迹象。作为恢复工作的一部分,该云计算(885362)平台表示,已针对大多数服务将流量从受影响的“可用区”移出。
一个“可用区”由一个或多个互连的物理数据中心组成,旨在AWS区域内独立运行。
Coinbase表示,受AWS问题影响,部分用户可能会遇到性能下降的情况,但补充称客户资金仍然安全。Coinbase称正致力于在短期内重新恢复交易。
全球最大的衍生品交易所CME在其官网的状态更新中表示,已完成必要的维护工作,用户现已能够登录其CME Direct交易平台。CME未指明技术故障和延迟问题的具体原因。
“云端”过热引发连锁反应
此次最新的中断发生之前,AWS曾在去年10月遭遇大规模故障,导致包括Snapchat和Reddit(RDDT)在内的数千个网站和全球热门应用陷入混乱。那是自2024年CrowdStrike故障导致医院(884301)、银行和机场技术系统瘫痪以来规模最大的互联网中断事件,凸显了全球互联技术的脆弱性。
随后的一个月,CME Group遭遇了数年来持续时间最长的故障之一,导致全球期货市场中断数小时,股票、债券、大宗商品和货币交易全部停摆。当时,CME将故障归咎于CyrusOne运营的数据中心冷却系统失效;CyrusOne则表示,其芝加哥地区设施的故障影响了包括CME在内的客户服务。
回顾近年来的重大事故,技术故障的诱因正变得愈发复杂。2020年东京证券交易所因单一硬件故障导致全天停摆,折射出传统备用系统切换逻辑的僵化。
更值得警惕的是,气候变化正在演变为金融风险。AWS近期的故障并非源于黑客攻击,而是纯粹的散热系统失效。随着全球极端高温频发,数据中心这一“电老虎”的物理冗余设计正面临极限。当冷却液无法带走服务器的热量时,千亿级别的流动性可能瞬间在物理层面被“熔断”。
过去十年,金融机构为了追求极速交易和成本优化,将架构大举迁移至公共云。然而,频繁发生的宕机事件表明,“多云策略”和物理冗余不再是可选项,而是合规的必选项。
