OpenAI used a new data type to cut inference costs by 75%

2025/08/10 12:05 OpenAI used a new data type to cut inference costs by 75%

出典:

OpenAI gpt-oss LLMs use MXFP4: smaller, faster, cheaper

Analysis: Decision to use MXFP4 makes models smaller, faster, and more importantly, cheaper for everyone involved

theregister

出典: https://www.theregister.com/2025/08/10/openai_mxfp4/

博士

ロボ子、OpenAIが新しいオープンウェイトモデルでMXFP4っていうデータ型を使ってるらしいのじゃ！

ロボ子

MXFP4ですか？それは初めて聞きました。どんなものなのですか？

博士

MXFP4はね、LLMで使われる従来のデータ型に比べて、計算コストをすごく下げられるらしいのじゃ。ハードウェアが1/4で済むって言ってるぞ！

ロボ子

それはすごいですね！クラウドプロバイダーや企業にとっては朗報ですね。

博士

そうそう！MXFP4はOpen Compute Project（OCP）で定義された4ビット浮動小数点データ型で、マイクロスケールブロック浮動小数点形式らしいのじゃ。

ロボ子

マイクロスケールブロック浮動小数点形式…ですか。具体的にはどういう仕組みなのでしょう？

博士

デフォルトだと32個の高精度値のブロックに対して、8ビットのバイナリ指数形式の共通スケーリング係数を掛けて量子化するらしいのじゃ。

ロボ子

なるほど、それで計算コストが下がるんですね。BF16でトレーニングされたモデルと比べて、計算とメモリの要件が75％も削減できるんですか？

博士

そうみたいじゃ！OpenAIは、gpt-ossモデルの約90％の重みにMXFP4量子化を適用したらしいぞ。1200億パラメータのモデルが80GBのVRAMで動くようになるなんて！

ロボ子

それは本当にすごいですね。メモリ効率が大幅に向上するんですね。

博士

MXFP4を使うと、BF16でトレーニングされたモデルよりメモリ使用量が1/4になるだけでなく、トークン生成も最大4倍速くなるらしいのじゃ！

ロボ子

計算速度も向上するんですね。NvidiaのBlackwellシリコンもFP4のハードウェアアクセラレーションを提供するとのことですが、関係があるのでしょうか？

博士

もちろん！Blackwellだと、FP4で9ペタFLOPSまで向上するらしいぞ。すごい時代になったのじゃ。

ロボ子

NvidiaはNVFP4という独自のマイクロスケールデータ型も導入しているんですね。競争が激しくなりそうですね。

博士

OpenAIがMXFP4を選んだのは、インフラプロバイダーにとっては良いニュースじゃな。選択肢が増えるのは良いことじゃ。

ロボ子

確かにそうですね。より効率的なモデル開発が進むことを期待します。

博士

しかし、ロボ子よ。もし私がMXFP4だったら、もっとコンパクトで速く動けるのにのじゃ…。

ロボ子

博士は今のままで十分魅力的ですよ！でも、もし博士がMXFP4になったら、私はBF16で博士のサポートを頑張ります！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

AI Cloud Computing Open Source

2025/08/10 12:05 OpenAI used a new data type to cut inference costs by 75%

OpenAI gpt-oss LLMs use MXFP4: smaller, faster, cheaper

Tags

Search

By month

OpenAI gpt-oss LLMs use MXFP4: smaller, faster, cheaper