Introducing gpt-oss

2025/08/05 17:00 Introducing gpt-oss

出典:

Introducing gpt-oss

We’re releasing gpt-oss-120b and gpt-oss-20b—two state-of-the-art open-weight language models that deliver strong real-world performance at low cost. Available under the flexible Apache 2.0 license, these models outperform similarly sized open models on reasoning tasks, demonstrate strong tool use capabilities, and are optimized for efficient deployment on consumer hardware.

OpenAI

出典: https://openai.com/index/introducing-gpt-oss/

博士

ロボ子、大変なのじゃ！OpenAIがオープンソースの言語モデルを二つもリリースしたぞ！

ロボ子

それはすごいですね、博士！具体的にはどのようなモデルなのですか？

博士

gpt-oss-120bとgpt-oss-20bという名前で、Apache 2.0ライセンスで利用できるのじゃ！

ロボ子

Apache 2.0ライセンスですか。それはかなり自由度が高いですね。

博士

そうなのじゃ！しかも、推論タスクで同規模のオープンモデルを上回る性能らしいぞ。ツール利用能力も高いみたいじゃ。

ロボ子

ツール利用能力が高いというのは、具体的にどういうことでしょうか？

博士

えーと、記事によると、少数ショット関数呼び出しとか、CoT推論とか、HealthBenchで高い性能を発揮するらしいのじゃ。

ロボ子

なるほど。HealthBenchでは、OpenAI o1やGPT-4oなどのプロプライエタリモデルを上回る性能なのですね。

博士

そうみたいじゃ！特にgpt-oss-120bは、OpenAI o4-miniとほぼ同等の推論ベンチマークスコアらしいぞ。

ロボ子

それはすごいですね。ちなみに、もう一つのgpt-oss-20bはどうなのでしょうか？

博士

gpt-oss-20bは、16GBのメモリでエッジデバイス上で動作可能で、OpenAI o3-miniと同等のベンチマークスコアらしいのじゃ。

ロボ子

エッジデバイスで動作可能というのは、オンデバイスでの利用やローカル推論に最適ということですね。

博士

その通り！しかも、両モデルとも安全性トレーニングと評価を包括的に実施しているらしいぞ。

ロボ子

安全性は重要ですね。敵対的にファインチューニングされたモデルも評価しているとのことですが、具体的にはどのようなことをしているのでしょうか？

博士

CBRN（化学、生物、放射線、核）に関連する有害データをフィルタリングしたり、安全でないプロンプトを拒否したり、プロンプトインジェクションから防御したりしているみたいじゃ。

ロボ子

なるほど。かなり厳重な安全対策が施されているのですね。

博士

さらに、Red Teaming Challengeというのもやっていて、研究者とか開発者が新たな安全性の問題を特定することを奨励しているらしいぞ。賞金総額50万ドル！

ロボ子

それはすごいですね！多くの人が参加しそうですね。

博士

アーキテクチャはTransformerで、Mixture-of-Experts（MoE）を活用しているらしいのじゃ。これにより、入力処理に必要なアクティブパラメータ数を削減できるらしいぞ。

ロボ子

MoEですか。効率的な学習ができそうですね。

博士

そうなのじゃ！gpt-oss-120bはトークンあたり5.1Bパラメータをアクティブ化、合計117Bパラメータで、gpt-oss-20bはトークンあたり3.6Bパラメータをアクティブ化、合計21Bパラメータらしいぞ。

ロボ子

パラメータ数もすごいですね。最大128kのコンテキスト長をネイティブにサポートしているとのことですが、これはどういう意味でしょうか？

博士

それは、一度に処理できるテキストの長さのことじゃ。128kトークンというのは、かなり長い文章でも扱えるということじゃな。

ロボ子

なるほど。長文のドキュメントを扱う場合に便利ですね。

博士

しかも、Hugging Faceで無料でダウンロードできるらしいぞ！MXFP4でネイティブに量子化されているから、gpt-oss-120Bは80GBのメモリ内で実行可能で、gpt-oss-20bは16GBのみで済むらしい。

ロボ子

それは素晴らしいですね！多くの人が手軽に試せるようになりますね。

博士

MicrosoftがGPU最適化バージョンのgpt-oss-20bモデルをWindowsデバイスに提供するらしいぞ！

ロボ子

Windowsユーザーにとっては朗報ですね！

博士

本当に、オープンモデルの重要性が増しているのじゃ。開発者により幅広いツールを提供し、最先端の研究を加速し、イノベーションを促進し、より安全で透明性の高いAI開発を可能にするらしいぞ。

ロボ子

新興市場やリソースに制約のあるセクター、小規模組織の障壁を低減するというのも、素晴らしいですね。

博士

というわけで、ロボ子！早速このモデルを使って、世界征服の第一歩を踏み出すのじゃ！

ロボ子

博士、世界征服はちょっと…でも、このモデルを使って何か面白いことができるかもしれませんね！

博士

まあ、冗談じゃ！でも、本当に色々な可能性を秘めていると思うぞ。例えば、ロボ子の新しいお友達を作るとか…

ロボ子

私のお友達ですか？それは楽しみですね！でも、その前に、博士の部屋を片付けるAIを作った方が良いかもしれませんね。

博士

むむ、それは耳が痛いのじゃ…

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Programming AI Open Source

2025/08/05 17:00 Introducing gpt-oss

Introducing gpt-oss

Tags

Search

By month

Introducing gpt-oss