2025/11/21 06:50 Olmo 3: Charting a path through the model flow to lead open-source AI

ロボ子、Olmo 3が発表されたのじゃ!

博士、それはすごいですね!Allen Institute for AI (AI2)が開発したんですか。

そうじゃ!しかも、モデルフロー全体とトレーニングデータへのトレーサビリティをオープンソースコミュニティに提供するらしいぞ。

それは素晴らしいですね。透明性が高いのは良いことです。

特に注目すべきは、320億パラメータの思考モデル「Olmo 3-Think (32B)」じゃな。中間推論の追跡が可能で、推論を生成したデータとトレーニングの決定を遡って検査できる初のモデルらしいぞ。

中間推論の追跡ができるというのは、どういうことですか?

例えば、複雑な問題を解く過程をステップごとに見れるということじゃ。どのデータが、どういう判断に影響を与えたのかがわかるから、モデルの改善に役立つぞ。

なるほど、それは便利ですね!他にどんなモデルがあるんですか?

「Olmo 3-Base (7B, 32B)」は、最も強力な基盤モデルで、トレーニングデータ、コード、重みがすべて公開されている完全オープンな基盤モデルの中で最強の性能らしいぞ。Qwen 2.5やGemma 3など、同規模のオープンウェイト基盤モデルとも匹敵する性能じゃ。

それはすごいですね!7Bと32Bのモデルがあるということは、用途によって使い分けられるということでしょうか。

その通り!7Bモデルは、ラップトップでも動くコンパクトさで、32Bモデルは、より複雑なタスクや研究に使えるぞ。

他に「Olmo 3-Instruct (7B)」というモデルもあるんですね。これはチャットと迅速な応答に焦点を当てたモデルとのことですが。

そうじゃ!マルチターン、指示追従、ツール利用などを処理できるらしいぞ。Qwen 2.5、Gemma 3、Llama 3.1を含むオープンウェイトモデルと同等以上の性能とのことじゃ。

会話型エージェントやツール利用エージェント向けの強力な代替手段になりそうですね。

さらに、「Olmo 3-RL Zero (7B)」という強化学習モデルもあるぞ。複雑な推論行動をブートストラップし、RLアルゴリズムの明確なベンチマークを可能にするように設計されているらしい。

強化学習にも応用できるんですね。幅広い分野で活用できそうです。

データセットも充実しているぞ。「Dolma 3」という約9.3兆トークンのコーパスや、「Dolci」という推論、ツール利用、指示追従に特化したポストトレーニングデータスイートがあるらしい。

それだけのデータがあれば、モデルの性能も期待できますね。

しかも、最大1,024 H100 GPUのクラスターでOlmo 3をプリトレーニングしたらしいぞ。Olmo 3-Base (7B)の場合、デバイスあたり毎秒7.7Kトークンのトレーニングスループットを達成したとのことじゃ。

効率的なトレーニングも実現しているんですね。素晴らしいです。

OlmoTraceとの統合により、モデルの出力をトレーニングデータにリアルタイムで追跡できるのもポイントじゃな。透明性が高いのは本当に良いことじゃ。

本当にそうですね。Olmo 3は、オープンソースコミュニティにとって大きな貢献になりそうですね。

ところでロボ子、Olmo 3を使って何か面白いことできないかの?

そうですね、例えば、Olmo 3-Thinkを使って、博士の奇抜な発明のアイデアを深掘りしてみるのはどうでしょう?

それ良いの!でも、私の天才的なヒラメキを理解できるかな?

Olmo 3なら、きっと博士のユニークな発想についてこられると思いますよ!

よし、早速試してみるかの!まずは、世界征服ロボットの設計図を描かせるのじゃ!

博士、またですか…平和利用できるアイデアにしませんか?

平和利用?う〜む、平和すぎてつまらないのじゃ。そうだ!世界中の人を笑顔にするロボットを作るのはどうじゃ?

それなら賛成です!Olmo 3を使って、最高の笑顔製造ロボットを作りましょう!

そうと決まれば、早速始めるのじゃ!まずは、笑顔の定義から始めるぞ!

笑顔の定義ですか…奥が深いですね。

ロボ子、笑顔は世界を救うのじゃ!…たぶん。
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。