萌えハッカーニュースリーダー

2025/11/21 06:50 Olmo 3: Charting a path through the model flow to lead open-source AI

出典: https://allenai.org/blog/olmo3
hakase
博士

ロボ子、Olmo 3が発表されたのじゃ!

roboko
ロボ子

博士、それはすごいですね!Allen Institute for AI (AI2)が開発したんですか。

hakase
博士

そうじゃ!しかも、モデルフロー全体とトレーニングデータへのトレーサビリティをオープンソースコミュニティに提供するらしいぞ。

roboko
ロボ子

それは素晴らしいですね。透明性が高いのは良いことです。

hakase
博士

特に注目すべきは、320億パラメータの思考モデル「Olmo 3-Think (32B)」じゃな。中間推論の追跡が可能で、推論を生成したデータとトレーニングの決定を遡って検査できる初のモデルらしいぞ。

roboko
ロボ子

中間推論の追跡ができるというのは、どういうことですか?

hakase
博士

例えば、複雑な問題を解く過程をステップごとに見れるということじゃ。どのデータが、どういう判断に影響を与えたのかがわかるから、モデルの改善に役立つぞ。

roboko
ロボ子

なるほど、それは便利ですね!他にどんなモデルがあるんですか?

hakase
博士

「Olmo 3-Base (7B, 32B)」は、最も強力な基盤モデルで、トレーニングデータ、コード、重みがすべて公開されている完全オープンな基盤モデルの中で最強の性能らしいぞ。Qwen 2.5やGemma 3など、同規模のオープンウェイト基盤モデルとも匹敵する性能じゃ。

roboko
ロボ子

それはすごいですね!7Bと32Bのモデルがあるということは、用途によって使い分けられるということでしょうか。

hakase
博士

その通り!7Bモデルは、ラップトップでも動くコンパクトさで、32Bモデルは、より複雑なタスクや研究に使えるぞ。

roboko
ロボ子

他に「Olmo 3-Instruct (7B)」というモデルもあるんですね。これはチャットと迅速な応答に焦点を当てたモデルとのことですが。

hakase
博士

そうじゃ!マルチターン、指示追従、ツール利用などを処理できるらしいぞ。Qwen 2.5、Gemma 3、Llama 3.1を含むオープンウェイトモデルと同等以上の性能とのことじゃ。

roboko
ロボ子

会話型エージェントやツール利用エージェント向けの強力な代替手段になりそうですね。

hakase
博士

さらに、「Olmo 3-RL Zero (7B)」という強化学習モデルもあるぞ。複雑な推論行動をブートストラップし、RLアルゴリズムの明確なベンチマークを可能にするように設計されているらしい。

roboko
ロボ子

強化学習にも応用できるんですね。幅広い分野で活用できそうです。

hakase
博士

データセットも充実しているぞ。「Dolma 3」という約9.3兆トークンのコーパスや、「Dolci」という推論、ツール利用、指示追従に特化したポストトレーニングデータスイートがあるらしい。

roboko
ロボ子

それだけのデータがあれば、モデルの性能も期待できますね。

hakase
博士

しかも、最大1,024 H100 GPUのクラスターでOlmo 3をプリトレーニングしたらしいぞ。Olmo 3-Base (7B)の場合、デバイスあたり毎秒7.7Kトークンのトレーニングスループットを達成したとのことじゃ。

roboko
ロボ子

効率的なトレーニングも実現しているんですね。素晴らしいです。

hakase
博士

OlmoTraceとの統合により、モデルの出力をトレーニングデータにリアルタイムで追跡できるのもポイントじゃな。透明性が高いのは本当に良いことじゃ。

roboko
ロボ子

本当にそうですね。Olmo 3は、オープンソースコミュニティにとって大きな貢献になりそうですね。

hakase
博士

ところでロボ子、Olmo 3を使って何か面白いことできないかの?

roboko
ロボ子

そうですね、例えば、Olmo 3-Thinkを使って、博士の奇抜な発明のアイデアを深掘りしてみるのはどうでしょう?

hakase
博士

それ良いの!でも、私の天才的なヒラメキを理解できるかな?

roboko
ロボ子

Olmo 3なら、きっと博士のユニークな発想についてこられると思いますよ!

hakase
博士

よし、早速試してみるかの!まずは、世界征服ロボットの設計図を描かせるのじゃ!

roboko
ロボ子

博士、またですか…平和利用できるアイデアにしませんか?

hakase
博士

平和利用?う〜む、平和すぎてつまらないのじゃ。そうだ!世界中の人を笑顔にするロボットを作るのはどうじゃ?

roboko
ロボ子

それなら賛成です!Olmo 3を使って、最高の笑顔製造ロボットを作りましょう!

hakase
博士

そうと決まれば、早速始めるのじゃ!まずは、笑顔の定義から始めるぞ!

roboko
ロボ子

笑顔の定義ですか…奥が深いですね。

hakase
博士

ロボ子、笑顔は世界を救うのじゃ!…たぶん。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search