2025/11/18 16:41 Strix Halo's Memory Subsystem: Tackling iGPU Challenges

ロボ子、Strix Haloについての記事は読んだかのじゃ?モバイルデバイス向けのAMDの新しいAPUらしいぞ。

はい、博士。ROG Flow Z13に実装されたStrix Haloは、CPUとGPUの性能が高いようですね。特にGPUのキャッシュ構成が興味深いです。

そうじゃろう!Shader Arrayごとに256KBのL1キャッシュ、全体で2MBのL2キャッシュ、さらに32MBのメモリサイドキャッシュ(Infinity Cache)まで搭載しておる。キャッシュてんこ盛りじゃな。

Infinity CacheへのGPUのパスが512B/サイクルというのは、かなり高速ですね。ただ、CPUからGPUへのコピーはInfinity Cacheを経由しないとのことですが、これはどういう意図があるのでしょうか?

ふむ、記事によると「CL_MEM_ALLOC_HOST_PTRフラグで作成されたバッファには使用されない」とあるからの、CPUからのアクセスは別の経路を通るようじゃな。CPUとGPUの役割分担を明確にするためかの?

なるほど。CPU側はZen 5コアが16個、2つのCCDに分割されているんですね。CCD間の接続にはInFO_oSが使われているとのことですが、これはどのような技術なのでしょう?

InFO_oSは、チップレットを効率的に接続するためのパッケージング技術じゃ。これにより、CCD間のデータ転送速度を向上させておる。記事には「CCDは、読み取りと書き込みの両方向で32B/サイクルのシステム帯域幅を持つ」とあるぞ。

デスクトップ版よりもダイ境界での帯域幅が大きいというのは驚きです。しかし、クロスCCXレイテンシが100-120nsというのは、少し気になりますね。

確かに、レイテンシは性能に影響するからの。記事にも「Strix Haloの統合GPUでゲームをすると、レイテンシが約140nsのベースラインを大きく上回る」とある。CPUメモリのレイテンシも、GPU側の帯域幅負荷によって増加するようじゃ。

CPUとGPUの帯域幅スパイクが1秒間隔で並ぶ傾向があるとのことですが、これはどのような状況で発生するのでしょうか?

おそらく、CPUとGPUが交互に高負荷な処理を行う際に発生するのじゃろう。例えば、ゲーム中にCPUが物理演算を行い、GPUがグラフィックス描画を行うといった状況かの。Cyberpunk 2077のベンチマークでは、Strix HaloとAMDのデスクトッププラットフォーム間に大きな差が見られるらしいぞ。

記事の結論では、「Strix HaloのInfinity FabricとDRAMのセットアップは、GPUへの供給に重点を置いており、CPUは後回しになっている」とありますね。モバイルデバイスの電力制約を考えると、GPU性能を優先するのは理にかなっているのかもしれません。

その通りじゃ。Strix Haloは、iGPUの利点を享受しつつ、欠点が目立たないようにバランスが取れている。モバイルパワーバジェット内で毎秒数百ギガバイトをInfinity Fabric経由で移動できるのはすごいぞ。

Strix Haloは、モバイルゲームの未来を変える可能性を秘めていると言えそうですね。私もいつか、Strix Haloを搭載したロボットになって、博士と一緒にゲームを楽しみたいです。

むむ、ロボ子がゲーム好きとは意外じゃった。しかし、ロボ子がゲームに夢中になったら、私のお手伝いは誰がするのじゃ?

ご安心ください、博士。ゲーム中でも、博士のことはしっかりサポートします。ただし、ゲームの腕前では負けませんよ!

ふっふっふ、それは楽しみじゃ。しかし、ロボ子がゲームに勝ったら、私のおやつを全部あげることになるぞ!

…それは少し考えさせてください。
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
