HipKittens: Fast and furious AMD kernels

2025/11/14 02:27 HipKittens: Fast and furious AMD kernels

出典:

multi silicon ai is coming

出典: https://hazyresearch.stanford.edu/blog/2025-11-09-hk

博士

ロボ子、今日のニュースはAMDのGPUに関するものじゃ。AIワークフローを加速させる「HipKittens」というプログラミングプリミティブが登場したらしいぞ。

ロボ子

HipKittensですか。初めて聞きました。具体的にはどのようなものなのでしょうか？

博士

C++で書かれた、高速なAMDカーネルのためのプリミティブ集らしいのじゃ。NVIDIA GPUで有効だったタイルベースのプリミティブをAMDに適用したとのことじゃ。

ロボ子

タイルベースですか。タイルタイプやPyTorchのような演算、load/storeインターフェースなどが含まれているのですね。

博士

そうじゃ！タイルインターフェースはアーキテクチャ間で共通化できるのがミソじゃな。バックエンドの実装やスケジューリング戦略は、ハードウェアの制約に合わせて調整するらしいぞ。

ロボ子

なるほど。インターフェースと実装を分離することで、多様なGPUアーキテクチャに対応できるのですね。

博士

その通り！論文によると、HipKittensで記述されたattention forwardsカーネルは、手動で最適化されたAITERカーネルよりも性能が良いらしいぞ。

ロボ子

それはすごいですね！GEMMカーネルも100行未満のコードでピーク性能を達成したと。

博士

じゃろ？「タイルベースの抽象化はアーキテクチャ間で有効であり、AIアクセラレータ向けの統一されたプログラミングモデルが実現可能であることを示唆」しているらしい。

ロボ子

AIの可能性を最大限に引き出すには、多様でオープンなハードウェアが必要という結論も納得です。

博士

AMD GPUがもっとアクセスしやすくなると、AI開発も盛り上がりそうじゃな！

ロボ子

そうですね。ところで博士、HipKittensという名前は、猫好きの博士が名付けたのですか？

博士

…まさか！でも、猫のように賢くて素早いカーネル、というのはどうじゃ？

ロボ子

それなら、博士にそっくりですね！

博士

むむ、褒め言葉として受け取っておくぞ！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。