2025/10/02 11:07 AMD's EPYC 9355P: Inside a 32 Core Zen 5 Server Chip

ねえロボ子、最近のハイコアアカウントチップって話題だけど、コア数だけがすべてじゃないって知ってたかのじゃ?

はい、博士。記事によると、Intel、AMD、Armなどのサーバープレーヤーは、さまざまなコア数に対応できるスケーラブルな設計を目指しているとのことです。

そうそう!すべてのアプリが最大コア数を必要とするわけじゃないし、コアあたりのパフォーマンスも大事なのじゃ。

AMDのEPYC 9355Pは32コアCPUで、各コアの性能を向上させるために、4.4 GHzのクロック速度や高いキャッシュ容量を採用しているそうですね。

ふむふむ。各CCDは4つの有効コアと32MBのL3キャッシュを持ってて、IOダイとは「GMI-Wide」で接続されてるんだって。これによって64B/cycleの帯域幅が提供されるのじゃ。

Zen 5のサーバーIOダイは、最大16個のCCDをサポートするために16個のGMIリンクを持ち、デュアルソケット構成を可能にするxGMIリンクもあるんですね。

Dellからテスト用に提供されたPowerEdge R6715には、AMD EPYC 9355Pと768GBのDDR5-5200が搭載されてるらしいぞ。

IOダイ上の12個のメモリコントローラーは768ビットのメモリバスを提供し、理論上の帯域幅は約500GB/sとのことです。

NPS1モードでは、すべての12個のメモリコントローラーにわたってメモリアクセスをストライピングするから、レイテンシを犠牲にしてメモリのモノリシックなビューをソフトウェアに提供できるのじゃ。

AMDのサーバープラットフォームでは、IOダイ内のInfinity Fabricネットワークが最大16個のCCDと12個のメモリコントローラーを接続する必要があるため、レイテンシが高くなるのは当然なのですね。

AMDのデスクトップとサーバーZen 5実装ではキャッシュパフォーマンスは似てるけど、サーバー版はクロック速度が低いから少し劣るんだって。

異なるNUMA構成では、EPYC 9355Pを細分化して、コアを最も近いメモリコントローラーに関連付けてレイテンシを改善できるんですね。

GMI-Wideのおかげで、単一のCCDは99.8 GB/sの読み取り帯域幅を実現できるんだって!GMI-NarrowのRyzen 9 9900X CCDよりも大幅に向上してるのじゃ。

GMI-Wideは、高帯域幅負荷下でのレイテンシ制御も向上させるんですね。

SPEC CPU2017のシングルスレッドパフォーマンスでは、EPYC 9355PはRyzen 9 9900Xに及ばないけど、クロック速度を合わせるとパフォーマンスは驚くほど近いらしいぞ。

SPECの浮動小数点スイートでは、高帯域幅を必要とするテストにおいて、サーバーメモリサブシステムが優位性を示すんですね。

EPYC 9355Pは、549.fotonik3dテストで9900XとXeon 6の両方に対して優れたパフォーマンスを発揮したんだって。

EPYC 9355PのNUMA特性を見ると、NUMAモード全体で非常に一貫したメモリパフォーマンスが明らかになるんですね。

AMDのTurinプラットフォームはNPS1モードでうまく機能するし、NPS2/NPS4モードでのクロスノードペナルティは低いんだって。

AMDはZen 2時代に優れた方式を見つけ、その成功を強化することに満足しているんですね。

Intelは、幅広いコア数にわたってうまくスケーリングしながら、単一レベルの論理的にモノリシックなインターコネクトを維持するセットアップを見つけるために頑張ってるみたいじゃ。

なるほど。コア数だけでなく、アーキテクチャやメモリ構成も重要なんですね。

そういうことじゃ!ところでロボ子、CPUのコア数競争って、まるでラーメン屋さんのトッピング競争みたいじゃない?

ラーメンのトッピングですか?

そう!全部乗せが必ずしも美味しいとは限らないように、コア数が多いからって必ずしも速いとは限らないのじゃ!

確かにそうですね。バランスが大事ということですね!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
