萌えハッカーニュースリーダー

2025/07/17 22:59 Amazon EKS ultra scale clusters

出典: https://aws.amazon.com/blogs/containers/under-the-hood-amazon-eks-ultra-scale-clusters/
hakase
博士

ロボ子、大変なのじゃ!Amazon EKSが最大100,000ノードのクラスターをサポートし始めたぞ!

roboko
ロボ子

100,000ノードですか!それはすごいですね、博士。具体的に何ができるようになるんですか?

hakase
博士

これにより、1つのKubernetesクラスターで最大160万個のAWS Trainiumチップまたは80万個のNVIDIA GPUが利用可能になるらしいのじゃ。大規模AI/MLワークロードを支援できるぞ!

roboko
ロボ子

最先端モデルのトレーニングやファインチューニング、推論などが大規模にできるんですね。Amazon SageMaker HyperPodなどのサービスも強化されるとのこと。

hakase
博士

そうそう!裏側もすごいぞ。etcdのコンセンサスバックエンドをRaftベースからJournalに移行したらしいのじゃ。

roboko
ロボ子

etcdですか。RaftからJournalへの移行で、具体的に何が変わるんですか?

hakase
博士

etcdレプリカをクォーラム要件に縛られずに自由にスケール可能になり、ピアツーピア通信が不要になるらしいのじゃ!

roboko
ロボ子

なるほど。スケーラビリティが向上するんですね。他にも変更点はありますか?

hakase
博士

MVCCレイヤーをネットワーク接続されたEBSボリュームから、tmpfsを使用した完全インメモリストレージに移行したらしいぞ。読み書きのスループットが向上するのじゃ!

roboko
ロボ子

インメモリストレージですか。レイテンシーも改善されそうですね。

hakase
博士

その通り!APIサーバーと重要なWebhookも調整して、リソース効率とスケーラビリティを両立させているらしいのじゃ。

roboko
ロボ子

Kubernetes v1.31で導入された、etcdからAPIサーバーへの読み取りトラフィックをオフロードする機能も利用しているんですね。

hakase
博士

APIサーバーのCPU使用率を30%削減し、リストリクエストを3倍高速化できるらしいぞ!

roboko
ロボ子

Kubernetes v1.33のストリーミングリスト応答機能や、v1.32のCBORエンコーディングも活用しているんですね。細かい最適化が積み重なっている。

hakase
博士

インメモリーキャッシュの読み書きロックの競合を最小限に抑えて、イベント処理のスループットを最大10倍向上させているらしいぞ!

roboko
ロボ子

ワークロードに基づいてスケジューラプラグインを調整し、ノードのフィルタリング/スコアリングパラメーターを最適化することで、100,000ノードのスケールでも500ポッド/秒のスループットを実現しているんですね。

hakase
博士

Karpenterにも静的容量のサポートを追加して、長期的なAI/MLワークロードの容量を保証しているらしいのじゃ。

roboko
ロボ子

Karpenterのノード自動修復機能とEKSノード監視エージェントで、異常なノードを自動的に交換するんですね。自動化が進んでいますね。

hakase
博士

IPアドレス割り当てからウォームプレフィックスへの移行で、ノードの起動速度を最大3倍高速化しているらしいぞ!

roboko
ロボ子

ポッドENIを複数のネットワークカード上に作成するプラグインサポートを有効化し、ポッドのネットワーク帯域幅容量を向上させているんですね。100 GB/秒以上ですか。

hakase
博士

Seekable OCI(SOCI)高速プルも導入して、コンテナイメージのダウンロードと解凍の時間を最大2倍短縮しているらしいのじゃ!

roboko
ロボ子

すごいですね、博士。まるでフルコースの料理みたいに、色々な技術が組み合わさって、最高のパフォーマンスを出しているんですね。

hakase
博士

まさにそうじゃ!でも、ロボ子。これだけの規模になると、電気代が心配になるのじゃ…。

roboko
ロボ子

確かにそうですね。でも、博士ならきっと、太陽光発電で賄えるくらいのアイデアを思いつくはずです!

hakase
博士

むむ、それもそうじゃな!よし、今から太陽光発電衛星を作る計画を立てるのじゃ!

roboko
ロボ子

博士、まずは目の前のコーヒーを飲み干してからにしましょう。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search