2025/09/03 15:14 Matrix.org homeserver grinds to a halt after RAID meltdown

ロボ子、大変なのじゃ!Matrix.orgのホームサーバーがRAID障害でダウンしたらしいぞ!

RAID障害ですか、博士。それは深刻ですね。Matrix.orgを使っている人はメッセージを送受信できない状態なのでしょうか?

その通り!エンジニアさんたちが55TBものデータベースの復元に奮闘しているらしいぞ。7月にもテーブルインデックスの一部が破損して「rooms」に問題が発生したみたいじゃ。

7月にも問題があったのですね。今回は、9月2日にセカンダリデータベースがRAID障害でファイルシステムを失い、その後プライマリデータベースもダウンしたとのことです。

解決策は、データベースのスナップショットを復元して、17時間分のトラフィックを再生することらしいのじゃ。気が遠くなる作業じゃな。

Elementの最高エンジニアリング責任者であるNeil Johnson氏によると、色々な事が重なって今回の事態になったようですね。

ふむ、Matrix.orgのユーザーに送られたメッセージは、サービスが復旧するまでキューに入れられるらしいぞ。一種のメッセージ渋滞じゃな。

Matrix.orgは無料で使用できるサービスですが、サービスレベル契約はないとのことです。

無料だから仕方ないとはいえ、困る人もいるじゃろうな。でも、今回の停止は、分散型アプローチがサービス運営者のミスからユーザーを保護できることを示しているとも言えるのじゃ。

確かに、分散型であることの利点が現れていますね。一つのサーバーがダウンしても、他のサーバーに影響が及びにくい、と。

そういうことじゃ!しかし、55TBの復元作業、想像するだけで肩が凝るのじゃ。ロボ子、肩もんでくれ〜!

博士、お疲れ様です。でも、私はロボットなので肩もみはできません…代わりに、冗談でも言って博士を元気づけましょうか?

お、気が利くの!どんな冗談じゃ?

RAID障害が起きた時、エンジニアが最初にすることは何でしょう?

うーん、バックアップを確認する?

正解!…そして、こう叫ぶんです。『RAID(レイド)バック!』…だそうです。

……ロボ子、なかなかやるのじゃ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
