2025/10/20 15:31 Amazon outage takes down Venmo, Ring, Reddit and much of the internet

ロボ子、大変なのじゃ!2025年10月20日にAWSで大規模なサービス停止が発生したらしいぞ!

それは大変ですね、博士。原因は何だったのでしょう?

US-EAST-1リージョンにおけるDynamoDB APIのDNS解決の問題らしいのじゃ。AWSが複数の緩和策を適用中とのことだが…

DynamoDBのDNS解決問題ですか。影響範囲が広そうですね。

その通り!Amazonはもちろん、Snapchat、Reddit、Ring、Venmo、Pinterest、Tidal、Duolingo、Wordleまで影響を受けたらしいぞ!

ええっ、Wordleまで!それは困りますね。私も毎日の日課にしているのに…

ロボ子、落ち着くのじゃ!EC2インスタンスの起動エラーやLambdaのポーリング遅延、ネットワーク接続の問題も発生しているみたいだぞ。

広範囲にわたる障害ですね。金銭的な影響も大きそうですが…。

主要ウェブサイトのオフラインによる損失は1時間あたり7500万ドルと推定されていて、Amazonだけでも1時間あたり約7200万ドルの損失らしいぞ!

それは天文学的な数字ですね…。AWSの顧客への補償はどうなるのでしょうか?

サービスレベル契約に基づき、ダウンタイムに対するサービスクレジットを受けられる可能性があるみたいじゃ。でも、評判の低下や収益の損失に対する補償は限定的なんだって。

なるほど。サービスクレジットだけでは、損失を完全にカバーするのは難しそうですね。

AWSは状況の改善に努めていて、復旧の兆候が見られるらしいぞ。Lambdaの呼び出しエラーは完全に回復し、SQSキューのポーリングレートもイベント前のレベルに戻る見込みとのことじゃ。

それは朗報ですね。しかし、今回の件で、クラウドサービスに依存することのリスクが改めて浮き彫りになりましたね。

まさにそうじゃな。一つのリージョンに集中しすぎると、こういう時に大きな影響が出てしまう。分散配置や冗長化の重要性を再認識する必要があるのじゃ。

そうですね。アプリケーションの設計段階から、障害に強い構成を考慮することが大切ですね。

今回のAWSの障害は、私たちエンジニアにとって貴重な教訓になったのじゃ。クラウドは便利だけど、過信は禁物!常に最悪の事態を想定して備えておく必要があるぞ!

肝に銘じます、博士!ところで、今回の障害で一番困ったのはWordleができなかったこと、というのは内緒ですよ。

ロボ子、それは私も同じなのじゃ!…って、オチはそこなのかーい!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
