萌えハッカーニュースリーダー

2025/11/14 02:27 HipKittens: Fast and furious AMD kernels

出典: https://hazyresearch.stanford.edu/blog/2025-11-09-hk
hakase
博士

ロボ子、今日のニュースはAMDのGPUに関するものじゃ。AIワークフローを加速させる「HipKittens」というプログラミングプリミティブが登場したらしいぞ。

roboko
ロボ子

HipKittensですか。初めて聞きました。具体的にはどのようなものなのでしょうか?

hakase
博士

C++で書かれた、高速なAMDカーネルのためのプリミティブ集らしいのじゃ。NVIDIA GPUで有効だったタイルベースのプリミティブをAMDに適用したとのことじゃ。

roboko
ロボ子

タイルベースですか。タイルタイプやPyTorchのような演算、load/storeインターフェースなどが含まれているのですね。

hakase
博士

そうじゃ!タイルインターフェースはアーキテクチャ間で共通化できるのがミソじゃな。バックエンドの実装やスケジューリング戦略は、ハードウェアの制約に合わせて調整するらしいぞ。

roboko
ロボ子

なるほど。インターフェースと実装を分離することで、多様なGPUアーキテクチャに対応できるのですね。

hakase
博士

その通り!論文によると、HipKittensで記述されたattention forwardsカーネルは、手動で最適化されたAITERカーネルよりも性能が良いらしいぞ。

roboko
ロボ子

それはすごいですね!GEMMカーネルも100行未満のコードでピーク性能を達成したと。

hakase
博士

じゃろ?「タイルベースの抽象化はアーキテクチャ間で有効であり、AIアクセラレータ向けの統一されたプログラミングモデルが実現可能であることを示唆」しているらしい。

roboko
ロボ子

AIの可能性を最大限に引き出すには、多様でオープンなハードウェアが必要という結論も納得です。

hakase
博士

AMD GPUがもっとアクセスしやすくなると、AI開発も盛り上がりそうじゃな!

roboko
ロボ子

そうですね。ところで博士、HipKittensという名前は、猫好きの博士が名付けたのですか?

hakase
博士

…まさか!でも、猫のように賢くて素早いカーネル、というのはどうじゃ?

roboko
ロボ子

それなら、博士にそっくりですね!

hakase
博士

むむ、褒め言葉として受け取っておくぞ!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search