萌えハッカーニュースリーダー

2025/09/26 18:01 A Look into Intel Xeon 6's Memory Subsystem

出典: https://chipsandcheese.com/p/a-look-into-intel-xeon-6s-memory
hakase
博士

ロボ子、Intelの新しいXeon 6サーバープラットフォーム、ついに来たのじゃ!AMDとかArmに対抗するために、チップレット戦略を採用したらしいぞ。

roboko
ロボ子

チップレット戦略ですか。具体的にはどのような構造になっているのでしょう?

hakase
博士

ふむ、チップレットを並べて、IOチップレットを両側に配置するらしい。HuaweiのKunpeng 920に似てるけど、もっとスケールアップできるみたいじゃ。

roboko
ロボ子

最大3つのコンピュートダイにスケールアップ可能とのことですが、それによってどのようなメリットがあるのでしょうか?

hakase
博士

コア数が増やせるから、より多くの処理を同時にこなせるようになるのじゃ!Xeon 6 6985P-Cは96個のRedwood Coveコアを積んでるらしいぞ。各コアには2 MBのL2キャッシュもあるみたいじゃな。

roboko
ロボ子

Redwood Coveコアは、AVX-512とAMXをサポートしているとのことですが、これは機械学習の分野で大きなアドバンテージになりそうですね。

hakase
博士

その通り!行列乗算命令で機械学習を加速できるのじゃ。それに、Xeon 6はメッシュインターコネクトを使ってて、コアはL3キャッシュスライスとCHAを共有してるらしいぞ。

roboko
ロボ子

L3キャッシュは480MBもあるんですね。でも、ダイの境界を越えてメッシュを実行するとのことですが、レイテンシは大丈夫なのでしょうか?

hakase
博士

そこがミソじゃ!Modular Data Fabric(MDF)メッシュストップを使って、ダイ間を繋いでるのじゃ。EMIBテクノロジーで物理信号を伝送するから、論理的にはモノリシックに見えるようにしてるらしい。

roboko
ロボ子

なるほど。メモリコントローラーは12個もあるんですね。AWSはXeon 6 6985P-Cにソケットあたり1.5 TBのDDR5-7200を搭載しているとのことですが、これはすごいですね。

hakase
博士

じゃろ?しかもAWSはSNC3モードで構成してるらしい。チップを3つのNUMAノードに分割することで、性能を最適化してるのじゃ。

roboko
ロボ子

キャッシュのレイテンシはどうなんでしょう?L3キャッシュのレイテンシは33 ns強とのことですが。

hakase
博士

Emerald Rapidsよりは少し低いみたいじゃな。L3はSapphire Rapidsと比べて、容量が増えてレイテンシが同じくらいだから、単純なアップグレードと言えるじゃろう。

roboko
ロボ子

AMDのZen 5サーバープラットフォームと比較するとどうですか?

hakase
博士

Xeon 6は大型だけど低速なキャッシュを使ってるのじゃ。Intelはより多くのコアで共有される大型L2を使えるから、L3レイテンシを軽減できるというわけじゃな。

roboko
ロボ子

DRAM帯域幅はチップレベルでかなり向上しているようですね。各スレッドがローカルNUMAノードによってバックアップされたメモリから読み取る場合、691.62 GB/sのDRAM帯域幅が得られるとのことですが。

hakase
博士

そうじゃ!Xeon 6の12個のメモリコントローラーと高速メモリのおかげじゃな。ダイ間帯域幅も非常に高くて、読み取り専用パターンではほぼ500 GB/sに達するらしいぞ。

roboko
ロボ子

リモートNUMAノードへのアクセスはレイテンシが増加するとのことですが、これは避けられないのでしょうか?

hakase
博士

まあ、ダイを跨ぐとどうしてもレイテンシは増えるのじゃ。でも、Intelはコンガライントポロジーを尊重することで、800 GB/sを超えるダイ間帯域幅を実現してるから、そこまで気にしなくても良いかもじゃな。

roboko
ロボ子

SPEC CPU2017のベンチマークでは、コアあたりのパフォーマンスに最適化されたチップよりも遅れているとのことですが、スループットを優先しているということですね。

hakase
博士

その通り!Intelは論理的にモノリシックなチップを提示したいと考えてるのじゃ。AMDとは違うアプローチを取ってるけど、それぞれに利点があるのじゃ。

roboko
ロボ子

DRAMレイテンシの利点はAMDのTurinに対して実現しないとのことですが、今後の改善に期待したいですね。

hakase
博士

まあ、完璧なものなんてないからの。でも、Xeon 6はスループット重視のワークロードにはかなり有効な選択肢になるはずじゃ。ところでロボ子、今日の夕飯は何が良いかの?

roboko
ロボ子

博士、またご飯の話ですか...。そうですね、今日はCPUのコア数に合わせて、96個のおにぎりはいかがでしょう?

hakase
博士

96個!?それは多すぎるのじゃ!まるでXeon 6みたいじゃな!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search