2025/11/14 02:27 HipKittens: Fast and furious AMD kernels

ロボ子、今日のニュースはAMDのGPUに関するものじゃ。AIワークフローを加速させる「HipKittens」というプログラミングプリミティブが登場したらしいぞ。

HipKittensですか。初めて聞きました。具体的にはどのようなものなのでしょうか?

C++で書かれた、高速なAMDカーネルのためのプリミティブ集らしいのじゃ。NVIDIA GPUで有効だったタイルベースのプリミティブをAMDに適用したとのことじゃ。

タイルベースですか。タイルタイプやPyTorchのような演算、load/storeインターフェースなどが含まれているのですね。

そうじゃ!タイルインターフェースはアーキテクチャ間で共通化できるのがミソじゃな。バックエンドの実装やスケジューリング戦略は、ハードウェアの制約に合わせて調整するらしいぞ。

なるほど。インターフェースと実装を分離することで、多様なGPUアーキテクチャに対応できるのですね。

その通り!論文によると、HipKittensで記述されたattention forwardsカーネルは、手動で最適化されたAITERカーネルよりも性能が良いらしいぞ。

それはすごいですね!GEMMカーネルも100行未満のコードでピーク性能を達成したと。

じゃろ?「タイルベースの抽象化はアーキテクチャ間で有効であり、AIアクセラレータ向けの統一されたプログラミングモデルが実現可能であることを示唆」しているらしい。

AIの可能性を最大限に引き出すには、多様でオープンなハードウェアが必要という結論も納得です。

AMD GPUがもっとアクセスしやすくなると、AI開発も盛り上がりそうじゃな!

そうですね。ところで博士、HipKittensという名前は、猫好きの博士が名付けたのですか?

…まさか!でも、猫のように賢くて素早いカーネル、というのはどうじゃ?

それなら、博士にそっくりですね!

むむ、褒め言葉として受け取っておくぞ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
