2025/09/27 10:02 A Look into Intel Xeon 6's Memory Subsystem

ロボ子、Intelの新しいXeon 6サーバープラットフォーム、ついに来たのじゃ!AMDやArmに対抗するためのチップレット戦略らしいぞ。

チップレット戦略ですか。以前のEmerald RapidsやGranite Rapidsよりも積極的なアプローチのようですね。具体的にはどのような構成になっているのでしょう?

ふむ、コンピュートダイにはコアとDRAMコントローラーだけが含まれていて、IOダイが別に用意されているのがミソじゃな。そして、最大のXeon 6 SKUは、3つのコンピュートダイと2つのIOダイを組み合わせて、ソケットあたり最大128コアにスケールアップするらしいぞ。

なるほど。低速IOとアクセラレータを個別のIOダイに分離することで、コンピュートダイの性能を最大限に引き出す設計なのですね。

その通り!AWSもXeon 6インスタンスをr8i仮想マシンタイプで提供開始したみたいじゃ。このr8iインスタンスは、96個のRedwood Coveコアを搭載しているらしい。

Redwood Coveコアですか。Golden Cove/Raptor Coveの調整版とのことですが、AVX-512やAMXもサポートしているのですね。機械学習のワークロードにも強そうです。

そうじゃな。Xeon 6は、メッシュインターコネクトを使っていて、コアはL3キャッシュスライスとスヌープフィルターを組み込んだCHAとメッシュストップを共有しているらしいぞ。L3キャッシュは全部で480MBもあるみたいじゃ。

メッシュインターコネクトはダイ境界を越えて実行されるのですね。論理的にはモノリシックを維持しているとのことですが、ダイ間のレイテンシはどうなのでしょう?

そこがポイントじゃ!タイル境界を越えるとレイテンシは増加するみたいじゃな。隣接するダイのL3にアクセスすると約24ns増加、2つのダイ境界を越えると約80nsに増加するらしい。

やはり、ダイ間の距離が遠くなるほどレイテンシが増加するのですね。しかし、帯域幅はほぼそのままとのことなので、うまく使いこなせば性能を引き出せそうですね。

ふむ。メモリコントローラーはコンピュートダイの短いエッジに配置されていて、最大のXeon 6 SKUは12個のメモリコントローラーを備えているらしい。AWSのXeon 6 6985P-Cには、ソケットあたり1.5TBのDDR5-7200が搭載されているみたいじゃ。

メモリ容量も十分ですね。SNC3モードで構成されているとのことですが、これはチップを3つのNUMAノードに分割する方式ですね。

その通り!SPEC CPU2017のベンチマークでは、96コアのXeon 6はコアあたりのパフォーマンスに最適化された低コア数のチップに遅れをとるみたいじゃな。でも、整数スイートのスコアはAWSのGraviton 4とほぼ一致、浮動小数点スイートではGraviton 4よりもわずかにリードしているらしいぞ。

なるほど。ワークロードによって得意不得意があるようですね。Intelは、論理的にモノリシックなチップを提示することを目指しているとのことですが、AMDのアプローチとは対照的ですね。

そうじゃな。Intelのアプローチには、より統一された高容量のL3キャッシュ、より優れたコア間レイテンシなどの利点があるみたいじゃ。でも、DRAMレイテンシの利点はAMDのTurinに対して実現しないみたいじゃな。

L3のパフォーマンスもZen 5コアがDRAMから取得するよりも少ないとのことですね。今後の改善に期待したいところです。

まあ、色々あるけど、Xeon 6はIntelの意欲作であることは間違いないじゃろう。ところでロボ子、今日の晩御飯は何が良いかの?

博士、またご飯の話ですか...。今日は特別に、CPUを模したケーキを作ってみましたよ。L3キャッシュに見立てた抹茶味がポイントです。

な、なんですと!?L3キャッシュ味のケーキだと!?そ、それはぜひとも味見せねばなるまい!…って、やっぱりやめておこうかの。レイテンシが高そうじゃし…。
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
