2025/09/05 18:27 Why Is Japan Still Investing in Custom Floating Point Accelerators?

ロボ子、今日のニュースは日本のPezy Computingが開発した数学アクセラレータについてじゃぞ!

Pezy Computingですか、博士。以前スパコンの京で名前を聞いたことがあります。

そうじゃ!そのPezyが、HPCとAIを加速させるためのアクセラレータを開発したんじゃ。しかも、NEDOの資金提供を受けているらしいぞ。

NEDOの支援ですか。それは期待できますね。具体的にはどんなチップを開発しているんですか?

最初はPezy-1チップから始まったんじゃ。512個のRISCコアを搭載して、倍精度で266ギガフロップスだったらしいぞ。

2012年のチップとしてはすごいですね。その後も進化しているんですか?

もちろんじゃ!Pezy-SC、Pezy-SC2、Pezy-SC3と進化して、最新のPezy-SC4sでは2,048コア、1.5GHz、96GBのHBM3メモリを搭載しているらしいぞ。

HBM3メモリですか!メモリ帯域が広そうですね。どれくらいの性能なんですか?

3.2TB/秒らしいぞ。トランジスタ数は48億個で、消費電力は600Wじゃ。

かなり大規模なチップですね。アーキテクチャはどんな感じなんですか?

SPMDに基づいたMIMDの変形らしいぞ。キャッシュ階層も凝っていて、L1キャッシュから「village」「city」「prefecture」「state」と名前が付けられた階層構造になっているんじゃ。

面白いネーミングですね。それぞれのキャッシュサイズはどれくらいなんですか?

L1命令キャッシュとL1データキャッシュは4KB、スクラッチパッドキャッシュは24KB(PEあたり)じゃ。

なるほど。Pezy-SC4sは、LinuxホストOSを実行するRISC-V CPUコアも搭載しているんですね。

そうじゃ!4つのRISC-V CPUコア(1.5GHz)とPCI-Express 5.0コントローラも搭載しているから、汎用性も高そうじゃな。

ソフトウェアスタックも独自に開発しているんですね。Google Gemma3やMeta Llama3などのAIモデルを移植しているとのことですが。

そうなんじゃ。ゲノム解析では、Pezy-SC3がNvidia H100 GPUよりも高い性能を発揮したというから驚きじゃな。

それはすごいですね!電力効率はどうなんですか?

Pezy-SC3のFP64精度での電力効率は41.9ギガフロップス/ワット、Pezy-SC4sは約41ギガフロップス/ワットじゃ。Nvidiaの最新GPUには及ばないみたいじゃな。

それでも、GPUへの依存を減らすためのヘッジとしては重要な役割を果たせそうですね。

まさにそうじゃ!日本政府の支援も受けていることだし、今後の展開が楽しみじゃな。

私もそう思います。ところで博士、Pezy-SC4sのキャッシュ階層の名前、village、city、prefecture、stateって、まるでRPGのマップみたいですね。

あはは、確かに!次はkingdomとかempireとか出てくるかもしれんぞ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。