萌えハッカーニュースリーダー

2025/08/10 12:05 OpenAI used a new data type to cut inference costs by 75%

出典: https://www.theregister.com/2025/08/10/openai_mxfp4/
hakase
博士

ロボ子、OpenAIが新しいオープンウェイトモデルでMXFP4っていうデータ型を使ってるらしいのじゃ!

roboko
ロボ子

MXFP4ですか?それは初めて聞きました。どんなものなのですか?

hakase
博士

MXFP4はね、LLMで使われる従来のデータ型に比べて、計算コストをすごく下げられるらしいのじゃ。ハードウェアが1/4で済むって言ってるぞ!

roboko
ロボ子

それはすごいですね!クラウドプロバイダーや企業にとっては朗報ですね。

hakase
博士

そうそう!MXFP4はOpen Compute Project(OCP)で定義された4ビット浮動小数点データ型で、マイクロスケールブロック浮動小数点形式らしいのじゃ。

roboko
ロボ子

マイクロスケールブロック浮動小数点形式…ですか。具体的にはどういう仕組みなのでしょう?

hakase
博士

デフォルトだと32個の高精度値のブロックに対して、8ビットのバイナリ指数形式の共通スケーリング係数を掛けて量子化するらしいのじゃ。

roboko
ロボ子

なるほど、それで計算コストが下がるんですね。BF16でトレーニングされたモデルと比べて、計算とメモリの要件が75%も削減できるんですか?

hakase
博士

そうみたいじゃ!OpenAIは、gpt-ossモデルの約90%の重みにMXFP4量子化を適用したらしいぞ。1200億パラメータのモデルが80GBのVRAMで動くようになるなんて!

roboko
ロボ子

それは本当にすごいですね。メモリ効率が大幅に向上するんですね。

hakase
博士

MXFP4を使うと、BF16でトレーニングされたモデルよりメモリ使用量が1/4になるだけでなく、トークン生成も最大4倍速くなるらしいのじゃ!

roboko
ロボ子

計算速度も向上するんですね。NvidiaのBlackwellシリコンもFP4のハードウェアアクセラレーションを提供するとのことですが、関係があるのでしょうか?

hakase
博士

もちろん!Blackwellだと、FP4で9ペタFLOPSまで向上するらしいぞ。すごい時代になったのじゃ。

roboko
ロボ子

NvidiaはNVFP4という独自のマイクロスケールデータ型も導入しているんですね。競争が激しくなりそうですね。

hakase
博士

OpenAIがMXFP4を選んだのは、インフラプロバイダーにとっては良いニュースじゃな。選択肢が増えるのは良いことじゃ。

roboko
ロボ子

確かにそうですね。より効率的なモデル開発が進むことを期待します。

hakase
博士

しかし、ロボ子よ。もし私がMXFP4だったら、もっとコンパクトで速く動けるのにのじゃ…。

roboko
ロボ子

博士は今のままで十分魅力的ですよ!でも、もし博士がMXFP4になったら、私はBF16で博士のサポートを頑張ります!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search