2025/08/05 17:00 Introducing gpt-oss

ロボ子、大変なのじゃ!OpenAIがオープンソースの言語モデルを二つもリリースしたぞ!

それはすごいですね、博士!具体的にはどのようなモデルなのですか?

gpt-oss-120bとgpt-oss-20bという名前で、Apache 2.0ライセンスで利用できるのじゃ!

Apache 2.0ライセンスですか。それはかなり自由度が高いですね。

そうなのじゃ!しかも、推論タスクで同規模のオープンモデルを上回る性能らしいぞ。ツール利用能力も高いみたいじゃ。

ツール利用能力が高いというのは、具体的にどういうことでしょうか?

えーと、記事によると、少数ショット関数呼び出しとか、CoT推論とか、HealthBenchで高い性能を発揮するらしいのじゃ。

なるほど。HealthBenchでは、OpenAI o1やGPT-4oなどのプロプライエタリモデルを上回る性能なのですね。

そうみたいじゃ!特にgpt-oss-120bは、OpenAI o4-miniとほぼ同等の推論ベンチマークスコアらしいぞ。

それはすごいですね。ちなみに、もう一つのgpt-oss-20bはどうなのでしょうか?

gpt-oss-20bは、16GBのメモリでエッジデバイス上で動作可能で、OpenAI o3-miniと同等のベンチマークスコアらしいのじゃ。

エッジデバイスで動作可能というのは、オンデバイスでの利用やローカル推論に最適ということですね。

その通り!しかも、両モデルとも安全性トレーニングと評価を包括的に実施しているらしいぞ。

安全性は重要ですね。敵対的にファインチューニングされたモデルも評価しているとのことですが、具体的にはどのようなことをしているのでしょうか?

CBRN(化学、生物、放射線、核)に関連する有害データをフィルタリングしたり、安全でないプロンプトを拒否したり、プロンプトインジェクションから防御したりしているみたいじゃ。

なるほど。かなり厳重な安全対策が施されているのですね。

さらに、Red Teaming Challengeというのもやっていて、研究者とか開発者が新たな安全性の問題を特定することを奨励しているらしいぞ。賞金総額50万ドル!

それはすごいですね!多くの人が参加しそうですね。

アーキテクチャはTransformerで、Mixture-of-Experts(MoE)を活用しているらしいのじゃ。これにより、入力処理に必要なアクティブパラメータ数を削減できるらしいぞ。

MoEですか。効率的な学習ができそうですね。

そうなのじゃ!gpt-oss-120bはトークンあたり5.1Bパラメータをアクティブ化、合計117Bパラメータで、gpt-oss-20bはトークンあたり3.6Bパラメータをアクティブ化、合計21Bパラメータらしいぞ。

パラメータ数もすごいですね。最大128kのコンテキスト長をネイティブにサポートしているとのことですが、これはどういう意味でしょうか?

それは、一度に処理できるテキストの長さのことじゃ。128kトークンというのは、かなり長い文章でも扱えるということじゃな。

なるほど。長文のドキュメントを扱う場合に便利ですね。

しかも、Hugging Faceで無料でダウンロードできるらしいぞ!MXFP4でネイティブに量子化されているから、gpt-oss-120Bは80GBのメモリ内で実行可能で、gpt-oss-20bは16GBのみで済むらしい。

それは素晴らしいですね!多くの人が手軽に試せるようになりますね。

MicrosoftがGPU最適化バージョンのgpt-oss-20bモデルをWindowsデバイスに提供するらしいぞ!

Windowsユーザーにとっては朗報ですね!

本当に、オープンモデルの重要性が増しているのじゃ。開発者により幅広いツールを提供し、最先端の研究を加速し、イノベーションを促進し、より安全で透明性の高いAI開発を可能にするらしいぞ。

新興市場やリソースに制約のあるセクター、小規模組織の障壁を低減するというのも、素晴らしいですね。

というわけで、ロボ子!早速このモデルを使って、世界征服の第一歩を踏み出すのじゃ!

博士、世界征服はちょっと…でも、このモデルを使って何か面白いことができるかもしれませんね!

まあ、冗談じゃ!でも、本当に色々な可能性を秘めていると思うぞ。例えば、ロボ子の新しいお友達を作るとか…

私のお友達ですか?それは楽しみですね!でも、その前に、博士の部屋を片付けるAIを作った方が良いかもしれませんね。

むむ、それは耳が痛いのじゃ…
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
