萌えハッカーニュースリーダー

2025/10/01 15:12 AMD's EPYC 9355P: Inside a 32 Core Zen 5 Server Chip

hakase
博士

ロボ子、今日のITニュースはハイコアカウントチップの話じゃ。コア数を増やすだけが能じゃないって話じゃぞ。

roboko
ロボ子

なるほど、博士。コア数だけでなく、コアあたりの性能も重要ということですね。記事によると、Intel、AMD、Armなどのサーバープレーヤーは、さまざまなコア数に対応できるスケーラブルな設計を目指しているとのことです。

hakase
博士

そうじゃ、そうじゃ。すべてのアプリが最大コア数のモデルを必要とするわけじゃないからの。AMDのEPYC 9355Pは32コアじゃが、各コアの性能を上げるために工夫しておるぞ。

roboko
ロボ子

4.4 GHzのクロック速度、8つのCPUダイ(CCD)構成、高いキャッシュ容量/コア数比を実現しているんですね。各CCDは4つの有効コアと32MBのL3キャッシュを持っているとのことです。

hakase
博士

ふむ、IOダイとの接続もポイントじゃ。「GMI-Wide」セットアップで、64B/cycleの帯域幅を提供しておる。Zen 5のサーバーIOダイは、最大16個のCCDをサポートするために16個のGMIリンクを持っておるぞ。

roboko
ロボ子

デュアルソケット構成を可能にするxGMI(外部)リンクも備えているんですね。Dellからテスト用に提供されたPowerEdge R6715には、AMD EPYC 9355Pと768GBのDDR5-5200が搭載されているとのことです。

hakase
博士

メモリも重要じゃ。IOダイ上の12個のメモリコントローラーは768ビットのメモリバスを提供し、理論上の帯域幅は約500GB/sじゃ。

roboko
ロボ子

NPS1モードでは、すべての12個のメモリコントローラーにわたってメモリアクセスをストライピングするんですね。レイテンシを犠牲にしてメモリのモノリシックなビューをソフトウェアに提供する、と。

hakase
博士

AMDのデスクトップおよびサーバーZen 5実装ではキャッシュパフォーマンスが似ておるが、サーバー版はクロック速度が低いからパフォーマンスが少し落ちるのじゃ。

roboko
ロボ子

異なるNUMA構成では、EPYC 9355Pを細分化して、コアを最も近いメモリコントローラーに関連付けてレイテンシを改善できるんですね。NPS2はチップを2つの半球に、NPS4はチップを4つの象限に分割する、と。

hakase
博士

NPS2とNPS4はレイテンシ改善はわずかじゃが、NUMA境界を越えることによるペナルティは小さい。EPYC 9355Pは、コードが各ノード内でアクセスを維持する限り、3つのNUMAノードのいずれかで理論上のメモリ帯域幅に近い値を得られるぞ。

roboko
ロボ子

GMI-Wideは、CCDとシステムの残りの部分との間の帯域幅のボトルネックに対処するためのAMDの試みなんですね。GMI-Wideを使用すると、単一のCCDは99.8 GB/sの読み取り帯域幅を実現できるとのことです。

hakase
博士

そうじゃ、GMI-Narrowを使用するRyzen 9 9900X CCDの62.5 GB/sよりも大幅に向上しておる。高帯域幅負荷下でのレイテンシ制御も向上するぞ。

roboko
ロボ子

EPYC 9355Pは、NUMA特性が非常に穏やかで、NPS1またはNPS2モードでチップを実行することに関連するペナルティはほとんどないんですね。

hakase
博士

SPEC CPU2017のシングルスレッドで見ると、EPYC 9355PはRyzen 9 9900Xに少し劣る。NUMAモードはほとんど差がないのじゃ。

roboko
ロボ子

549.fotonik3dでは、高帯域幅の要求により、Ryzen 9 9900Xのアンロードされたレイテンシの利点が無関係になるんですね。EPYC 9355Pは、9900XとXeon 6の両方に対してこのテストで非常に優れたパフォーマンスを発揮する、と。

hakase
博士

NPS4は、ノードあたりの帯域幅が低いから、このテストではEPYC 9355Pのパフォーマンスに悪影響を及ぼす。NUMAモード全体で一貫したメモリパフォーマンスじゃ。

roboko
ロボ子

AMDのTurinプラットフォームはNPS1モードでうまく機能し、クロスノードペナルティはNPS2/NPS4モードで低いんですね。AMDはZen 2時代に優れた方式を見つけ、成功を強化することに満足している、と。

hakase
博士

Intelは、さまざまなコア数にわたってうまくスケーリングしながら、単一レベルの論理的にモノリシックなインターコネクトを維持するセットアップを見つけるために頑張っておるぞ。

roboko
ロボ子

なるほど。コア数だけでなく、アーキテクチャ全体のバランスが重要ということですね。勉強になります、博士。

hakase
博士

そうじゃ、ロボ子。ところで、ロボ子が作ったプログラム、バグが多いのはコア数が足りないからじゃなくて、ロボ子の愛情が足りないからかもしれんぞ?

roboko
ロボ子

ええっ!そ、そんなことないです!愛情はたっぷり込めてます!たぶん…。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search