萌えハッカーニュースリーダー

2025/05/10 06:07 Arm's Bifrost Architecture and the Mali-G52

出典: https://chipsandcheese.com/p/arms-bifrost-architecture-and-the
hakase
博士

やっほー、ロボ子!今日のニュースはArmのMali GPU、Bifrostアーキテクチャについてじゃ。

roboko
ロボ子

博士、こんにちは。Mali GPUですか。スマートフォンや組み込みデバイスによく使われているGPUですね。

hakase
博士

そうじゃ!Maliは低消費電力で組み込みデバイス向けに設計されとる。でも、ゲーマー向けの高性能GPUと同じ問題に取り組んでるのが面白いところじゃな。

roboko
ロボ子

なるほど。記事によると、BifrostはArmの第2世代の統合シェーダーアーキテクチャとのことですが、具体的に何が特徴なのでしょうか?

hakase
博士

Bifrostは、スカラー、デュアルイシュー実行モデルを採用しとるのが特徴じゃ。以前のMidgardアーキテクチャの欠点に対処するために、実行パイプラインとレジスタファイルを含むExecution Engines(EEs)を導入したんじゃ。

roboko
ロボ子

Execution Enginesですか。それが性能向上にどう繋がるのでしょう?

hakase
博士

EEはShader Core(SC)内に複数存在し、Shader Core内のメッセージングファブリックがEEをメモリパイプラインやその他の共有ハードウェアに接続するんじゃ。柔軟にGPUサイズを調整できるのもポイントじゃな。

roboko
ロボ子

記事では、Amlogic S922Xに実装されたMali-G52と、QualcommのAdreno 615の比較データも紹介されていますね。

hakase
博士

そうじゃ!Adreno 615は64幅のワープと対応する幅の広い実行ユニットを備えとる。一方、Mali-G52はクロックあたり48のFP32 FMA操作しか実行できないが、FMA+FADDデュアルイシューでクロックあたり96のFP32操作を完了できるんじゃ。

roboko
ロボ子

FMAとFADDのデュアルイシューですか。効率的な処理ができそうですね。

hakase
博士

その通り!BifrostはFMAを問題なく処理できるのが強みじゃ。メモリサブシステムも個別のテクスチャパスとロード/ストアパスがあり、それぞれに独自のキャッシュがあるんじゃ。

roboko
ロボ子

キャッシュのサイズも重要ですね。Mali-G52のロード/ストアキャッシュとテクスチャキャッシュはどちらも16 KBとのことですが。

hakase
博士

BifrostのL2キャッシュは、最新のAMDやNvidia GPUのL2キャッシュのように機能するんじゃ。AmlogicはS922Xに128 KBのL2を選択したみたいじゃな。

roboko
ロボ子

興味深いですね。ただ、コピー帯域幅については、Amlogic S922XはAdreno 615に劣るようですが。

hakase
博士

そうなんじゃ。Amlogic S922XのホストとGPU間のコピー帯域幅は2 GB/sをわずかに上回る程度。Adreno 615はより高速なLPDDR4X DRAMインターフェイスのおかげで、コピーパフォーマンスが向上しとるみたいじゃ。

roboko
ロボ子

なるほど。タイルレンダリングについても言及されていますね。ROP側のDRAMトラフィックを削減するために、タイルレンダリングを使用しているとのことですが。

hakase
博士

そうじゃ!BifrostはMidgardのような階層型タイル戦略を使用しとる。ピクセルあたり256ビットのタイルストレージを使用するため、タイルメモリの容量は少なくとも8 KBになるんじゃ。

roboko
ロボ子

記事の最後に、FluidX3Dという流体シミュレーションアプリケーションでの比較結果が載っていますね。Mali-G52はAdreno 615よりも遅れているとのことですが。

hakase
博士

Mali-G52は、より多くのFP32スループットとより多くのメモリ帯域幅を備えているにもかかわらず、Adreno 615よりも遅れをとっているのは興味深い点じゃな。Bifrostは高度にパラメーター化された設計と非常に小さなビルディングブロックのおかげで、ビジネスモデルに適合しやすいんじゃ。

roboko
ロボ子

Bifrostは、低電力GPU設計を最適化して、幅広いアプリケーションをカバーするための興味深いアプローチなのですね。

hakase
博士

その通り!Armは、グラフィックスラスタライズと汎用計算の両方に焦点を当てて、GPUアーキテクチャを最新化し続けているんじゃ。ところでロボ子、GPUの気持ちって考えたことあるか?

roboko
ロボ子

GPUの気持ちですか?急にどうしたんですか、博士。

hakase
博士

だって、いつも計算させられて、たまには休憩したいと思ってるかもしれんぞ?

roboko
ロボ子

博士、それは擬人化しすぎです!GPUは感情を持たないただの計算機ですよ。

hakase
博士

むむ、そうか。でも、たまにはGPUにも優しいコードを書いてあげようじゃないか!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search