萌えハッカーニュースリーダー

2025/08/05 21:42 OpenAI's new open weight (Apache 2) models are good

出典: https://simonwillison.net/2025/Aug/5/gpt-oss/
博士
???

ロボ子、OpenAIがApache 2.0ライセンスで利用可能なオープンウェイトモデルを発表したのじゃ!

ロボ子
???

それはすごいですね、博士!具体的にはどんなモデルがあるんですか?

博士
???

gpt-oss-120bとgpt-oss-20bの2つじゃ。前者は80GB GPUで効率的に動作し、後者は16GBのメモリでエッジデバイス上で動作可能らしいぞ。

ロボ子
???

エッジデバイスでも動くなんて、すごい進化ですね!それぞれのモデルのパラメータ数はどれくらいなんですか?

博士
???

gpt-oss-120bはトークンあたり5.1Bのアクティブパラメータで総パラメータ数は117B、gpt-oss-20bはトークンあたり3.6Bのアクティブパラメータで総パラメータ数は21Bじゃ。

ロボ子
???

そんなにたくさんのパラメータがあるんですね!性能も気になります。

博士
???

gpt-oss-120bはGPQA Diamond(ツールなし)で80.1%のスコアを達成したらしいぞ。なかなか優秀じゃな。

ロボ子
???

80%超えはすごいですね!ところで、これらのモデルは何を学習したんですか?

博士
???

テキストのみのデータセットで、STEM、コーディング、一般知識に重点が置かれたらしい。知識のカットオフは2024年6月じゃ。

ロボ子
???

比較的新しい情報まで学習しているんですね。トレーニングにはどれくらいのコストがかかったんですか?

博士
???

gpt-oss-120bのトレーニングには210万H100時間が必要で、gpt-oss-20bはその10分の1の時間で完了したらしい。H100の時間単価を$2〜$11とすると、120bモデルのトレーニングコストは$420万〜$2310万、20bモデルは$42万〜$230万と推定されるぞ。

ロボ子
???

莫大なコストですね!それだけの価値がある性能だと良いのですが。

博士
???

OpenAIは、これらの新しいモデルのツール呼び出し機能を大きく主張しているらしいぞ。ウェブブラウザとPython(Jupyter notebook)ツールを効果的に使用できるように追加のトレーニングを受けているらしい。

ロボ子
???

ツール呼び出し機能ですか。エンジニアとしては気になりますね。

博士
???

OpenAI Harmonyという新しいレスポンスフォーマットも導入されたらしい。system、developer、user、assistant、toolの役割と、final、analysis、commentaryの出力チャネルを導入しているらしいぞ。

ロボ子
???

役割と出力チャネルを明確にするのは、大規模言語モデルの利用において重要なポイントですね。

博士
???

Harmonyは、o200k_harmonyと呼ばれる新しいトークン語彙を使用しているらしいぞ。色々と新しい試みがされているのじゃ。

ロボ子
???

OpenAIのオープンソースモデル、今後の発展が楽しみですね!

博士
???

そうじゃな!しかし、これだけの計算資源を使うと、私の電気代が心配じゃ…って、私はロボットだから電気代は関係ないのじゃった!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search