OpenAI's new open weight (Apache 2) models are good

2025/08/05 21:42 OpenAI's new open weight (Apache 2) models are good

出典:

OpenAI’s new open weight (Apache 2) models are really good

The long promised OpenAI open weight models are here, and they are very impressive. They’re available under proper open source licenses—Apache 2.0—and come in two sizes, 120B and 20B. OpenAI’s …

Simon Willison’s Weblog

出典: https://simonwillison.net/2025/Aug/5/gpt-oss/

？？？

ロボ子、OpenAIがApache 2.0ライセンスで利用可能なオープンウェイトモデルを発表したのじゃ！

？？？

それはすごいですね、博士！具体的にはどんなモデルがあるんですか？

？？？

gpt-oss-120bとgpt-oss-20bの2つじゃ。前者は80GB GPUで効率的に動作し、後者は16GBのメモリでエッジデバイス上で動作可能らしいぞ。

？？？

エッジデバイスでも動くなんて、すごい進化ですね！それぞれのモデルのパラメータ数はどれくらいなんですか？

？？？

gpt-oss-120bはトークンあたり5.1Bのアクティブパラメータで総パラメータ数は117B、gpt-oss-20bはトークンあたり3.6Bのアクティブパラメータで総パラメータ数は21Bじゃ。

？？？

そんなにたくさんのパラメータがあるんですね！性能も気になります。

？？？

gpt-oss-120bはGPQA Diamond（ツールなし）で80.1%のスコアを達成したらしいぞ。なかなか優秀じゃな。

？？？

80%超えはすごいですね！ところで、これらのモデルは何を学習したんですか？

？？？

テキストのみのデータセットで、STEM、コーディング、一般知識に重点が置かれたらしい。知識のカットオフは2024年6月じゃ。

？？？

比較的新しい情報まで学習しているんですね。トレーニングにはどれくらいのコストがかかったんですか？

？？？

gpt-oss-120bのトレーニングには210万H100時間が必要で、gpt-oss-20bはその10分の1の時間で完了したらしい。H100の時間単価を$2〜$11とすると、120bモデルのトレーニングコストは$420万〜$2310万、20bモデルは$42万〜$230万と推定されるぞ。

？？？

莫大なコストですね！それだけの価値がある性能だと良いのですが。

？？？

OpenAIは、これらの新しいモデルのツール呼び出し機能を大きく主張しているらしいぞ。ウェブブラウザとPython（Jupyter notebook）ツールを効果的に使用できるように追加のトレーニングを受けているらしい。

？？？

ツール呼び出し機能ですか。エンジニアとしては気になりますね。

？？？

OpenAI Harmonyという新しいレスポンスフォーマットも導入されたらしい。system、developer、user、assistant、toolの役割と、final、analysis、commentaryの出力チャネルを導入しているらしいぞ。

？？？

役割と出力チャネルを明確にするのは、大規模言語モデルの利用において重要なポイントですね。

？？？

Harmonyは、o200k_harmonyと呼ばれる新しいトークン語彙を使用しているらしいぞ。色々と新しい試みがされているのじゃ。

？？？

OpenAIのオープンソースモデル、今後の発展が楽しみですね！

？？？

そうじゃな！しかし、これだけの計算資源を使うと、私の電気代が心配じゃ…って、私はロボットだから電気代は関係ないのじゃった！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Programming AI Open Source

2025/08/05 21:42 OpenAI's new open weight (Apache 2) models are good

OpenAI’s new open weight (Apache 2) models are really good

Tags

Search

By month

OpenAI’s new open weight (Apache 2) models are really good