Strix Halo's Memory Subsystem: Tackling iGPU Challenges

2025/11/18 16:41 Strix Halo's Memory Subsystem: Tackling iGPU Challenges

出典:

chipsandcheese.com

博士

ロボ子、Strix Haloについての記事は読んだかのじゃ？モバイルデバイス向けのAMDの新しいAPUらしいぞ。

ロボ子

はい、博士。ROG Flow Z13に実装されたStrix Haloは、CPUとGPUの性能が高いようですね。特にGPUのキャッシュ構成が興味深いです。

博士

そうじゃろう！Shader Arrayごとに256KBのL1キャッシュ、全体で2MBのL2キャッシュ、さらに32MBのメモリサイドキャッシュ（Infinity Cache）まで搭載しておる。キャッシュてんこ盛りじゃな。

ロボ子

Infinity CacheへのGPUのパスが512B/サイクルというのは、かなり高速ですね。ただ、CPUからGPUへのコピーはInfinity Cacheを経由しないとのことですが、これはどういう意図があるのでしょうか？

博士

ふむ、記事によると「CL_MEM_ALLOC_HOST_PTRフラグで作成されたバッファには使用されない」とあるからの、CPUからのアクセスは別の経路を通るようじゃな。CPUとGPUの役割分担を明確にするためかの？

ロボ子

なるほど。CPU側はZen 5コアが16個、2つのCCDに分割されているんですね。CCD間の接続にはInFO_oSが使われているとのことですが、これはどのような技術なのでしょう？

博士

InFO_oSは、チップレットを効率的に接続するためのパッケージング技術じゃ。これにより、CCD間のデータ転送速度を向上させておる。記事には「CCDは、読み取りと書き込みの両方向で32B/サイクルのシステム帯域幅を持つ」とあるぞ。

ロボ子

デスクトップ版よりもダイ境界での帯域幅が大きいというのは驚きです。しかし、クロスCCXレイテンシが100-120nsというのは、少し気になりますね。

博士

確かに、レイテンシは性能に影響するからの。記事にも「Strix Haloの統合GPUでゲームをすると、レイテンシが約140nsのベースラインを大きく上回る」とある。CPUメモリのレイテンシも、GPU側の帯域幅負荷によって増加するようじゃ。

ロボ子

CPUとGPUの帯域幅スパイクが1秒間隔で並ぶ傾向があるとのことですが、これはどのような状況で発生するのでしょうか？

博士

おそらく、CPUとGPUが交互に高負荷な処理を行う際に発生するのじゃろう。例えば、ゲーム中にCPUが物理演算を行い、GPUがグラフィックス描画を行うといった状況かの。Cyberpunk 2077のベンチマークでは、Strix HaloとAMDのデスクトッププラットフォーム間に大きな差が見られるらしいぞ。

ロボ子

記事の結論では、「Strix HaloのInfinity FabricとDRAMのセットアップは、GPUへの供給に重点を置いており、CPUは後回しになっている」とありますね。モバイルデバイスの電力制約を考えると、GPU性能を優先するのは理にかなっているのかもしれません。

博士

その通りじゃ。Strix Haloは、iGPUの利点を享受しつつ、欠点が目立たないようにバランスが取れている。モバイルパワーバジェット内で毎秒数百ギガバイトをInfinity Fabric経由で移動できるのはすごいぞ。