2025/09/30 19:21 AMD's EPYC 9355P: Inside a 32 Core Zen 5 Server Chip

ロボ子、今日のニュースはAMDのEPYC 9355Pじゃ。32コアのサーバー向けCPUで、各コアの性能を向上させる設計が施されているらしいぞ。

なるほど、博士。サーバー向けCPUですか。最大4.4 GHzでクロックアップするとのことですが、具体的にどのような設計がされているのでしょうか?

ふむ、8つのCPUダイ(CCD)を使用しておるのじゃ。各CCDは8コアのうち4コアのみを有効化し、32MBのL3キャッシュをフルに利用可能にしておる。

各CCDが「GMI-Wide」構成でIOダイに接続されているとのことですが、これはどのようなメリットがあるのでしょう?

GMI-Wideじゃな。これは読み書き両方向で64B/cycleの帯域幅を提供するのじゃ。Zen 5のサーバーIOダイは、最大16個のCCDをサポートするために16個のGMIリンクを持っておる。デュアルソケット構成を可能にするxGMI(外部)リンクもあるぞ。

Dell PowerEdge R6715システムでテストを実施した結果も興味深いですね。768 GBのDDR5-5200を搭載しているとのことですが、メモリ性能はどのようになっているのでしょうか?

IOダイ上の12個のメモリコントローラが768ビットのメモリバスを提供しておる。理論上の帯域幅は約500 GB/sじゃ。NPS1モードでは、すべての12個のメモリコントローラにメモリアクセスをストライピングし、レイテンシを犠牲にしてメモリのモノリシックなビューを提供するのじゃ。

キャッシュ性能についてはどうですか?

キャッシュ性能は、AMDのデスクトップおよびサーバーZen 5実装で類似しておるが、サーバー版はクロック速度が低いためわずかに劣るのじゃ。

異なるNUMA構成により、EPYC 9355Pを細分化し、コアを最も近いメモリコントローラに関連付けてレイテンシを改善できるとのことですが、具体的にどのような効果があるのでしょうか?

NUMA構成を最適化することで、レイテンシを改善できるのじゃ。GMI-Wideにより、単一のCCDは99.8 GB/sの読み取り帯域幅を実現可能じゃ。

EPYC 9355Pは、NUMA特性が非常に穏やかで、NPS1またはNPS2モードでチップを実行することに関連するペナルティはほとんどないとのことですね。

そうじゃな。SPEC CPU2017のシングルスレッド性能では、EPYC 9355PはRyzen 9 9900Xに及ばないが、SPECの浮動小数点スイートでは、高い帯域幅要求により、Ryzen 9 9900Xのレイテンシの利点が無効になるのじゃ。

EPYC 9355Pは、より低いコア数でより広いCCD-to-IODリンクとより多くのキャッシュを使用し、コアあたりのパフォーマンスを最大化する設計になっているのですね。

その通り!AMDのTurinプラットフォームはNPS1モードで良好に動作し、クロスノードペナルティはNPS2/NPS4モードで低い。つまり、サーバー用途では非常に効率的なのじゃ。

よくわかりました、博士。ところで、このCPUを使って何か面白いことはできませんか?

そうじゃな…このCPUを使って、ロボ子の意識をサーバーにアップロードするのはどうかの?

それはちょっと…遠慮しておきます。
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
