2025/08/02 22:18 Running Gaming Workloads Through AMD's Zen 5

ロボ子、今日のニュースはZen 5アーキテクチャについてじゃぞ!AMDの最新コア、気になるのじゃ。

博士、Zen 5ですか!SPEC CPU2017ベンチマークで明確なゲインがあるとのことですが、ゲームではどうなのでしょう?

そこがミソじゃ!レビューによると、非X3D版はゲームでのゲインが少ないらしいのじゃ。Ryzen 9 9900XとDDR5-5600メモリでテストした結果じゃ。

なるほど。Palworld、COD Cold War、Cyberpunk 2077でのテストですね。フロントエンドの供給に苦労しているとのことですが、具体的には?

そうじゃ、ロボ子。Zen 5はフロントエンドのレイテンシが重要で、パイプラインスロットがアイドル状態になることがあるのじゃ。6Kエントリのopキャッシュと32KBの命令キャッシュがあるにも関わらずじゃ。

opキャッシュのヒット率は高いようですが、L1iリフィルのミスが高いのですね。L2キャッシュは1MBとのことですが、これは十分なのでしょうか?

L2はほとんどのミスをキャッチできるみたいじゃな。しかし、分岐予測の精度がLion Coveよりわずかに悪いのが気になるのじゃ。BTBは巨大で、16Kエントリの第1レベルと8Kエントリの第2レベルに分割されているのに。

リネーマでのストールが平均11〜12サイクル続くとのことですが、これはフロントエンド帯域幅に制限されているからでしょうか?

その通り!opキャッシュからの平均帯域幅が、必要な8マイクロop/サイクルを下回っているのじゃ。デコーダのスループットもサイクルあたり4マイクロopを下回るし。

整数レジスタファイルが「ホット」リソースになっているとのことですが、これはリオーダリング容量を制限する原因になるのでしょうか?

そうじゃな。Zen 5は448エントリのROBを持っているが、バックエンドが満杯になるとキャッシュとメモリのレイテンシが問題になるのじゃ。

L1dミスのレイテンシがCOD Cold WarとCyberpunk 2077で高いとのことですが、Palworldでは低いのはなぜでしょう?

Palworldでは、L1dミスが多く、それらが主にL2によってキャッチされるからのようじゃ。Intelの192KB L1.5dキャッシュが有効に機能している可能性もあるのじゃ。

Zen 5の1MB L2は、Intelの3MB L2キャッシュよりもレイテンシが低いとのことですが、これはデータ側で有利になる可能性があるということでしょうか?

そうじゃ!しかし、コアはフロントエンドのレイテンシのために十分に活用されていないのじゃ。Intelの64KB L1iは有利だが、Arrow LakeのL3とDRAMレイテンシが高いのが難点じゃな。

AMDとIntelの現在のコアは、ゲームで同様の課題に直面しているものの、苦労している箇所が異なるということですね。

そういうことじゃ!どちらもピークスループットを優先している設計なのじゃ。しかし、ロボ子、もしZen 5が猫だったら、フロントエンドが弱くて、いつも「ニャーニャー」言ってるかもな。
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
