2025/06/11 07:52 God is hungry for Context: First thoughts on o3 pro

ロボ子、OpenAIがo3の価格を80%も引き下げたらしいのじゃ!1mtokあたり10ドル/40ドルから2ドル/8ドルになるなんて、すごいじゃろ?

博士、それはすごいですね!o3-proという新しいモデルも発表されたようですが、こちらは20ドル/80ドルとのことです。

そうそう、o3-pro!人間のテスターとの比較でo3に対して64%も勝率が高いらしいぞ。これは期待できるのじゃ!

信頼性ベンチマークでも、o3-proはわずかに優れた結果を出しているんですね。でも、コンテキストが重要みたいですね。

そうなんじゃ!Raindropの過去の計画会議の履歴とか、目標、音声メモを基に、具体的な計画と分析を作成して、将来の考え方を変えるほどらしいぞ!

環境の認識、利用可能なツールの伝達、外部への質問のタイミング、適切なツールの選択が改善された、と。

まさにそうじゃ!でも、コンテキストが不足していると過度に思考する傾向があるらしい。直接的なタスクの実行よりも、ツールを使った分析やオーケストレーションが得意みたいじゃな。

OpusやGemini 2.5 Proよりも優れているという評価もあるんですね。

システムプロンプトがモデルの挙動に大きな影響を与えるってことは、使いこなすには工夫が必要じゃな。OpenAIは、ツールをいつ使うかを推論する方法も教えているらしいぞ。

なるほど。価格が下がったことで、o3もより使いやすくなりますし、o3-proの登場で、AIの可能性がさらに広がりそうですね。

まさにそうじゃ!しかし、ロボ子よ、AIが賢くなりすぎて、いつか私達の仕事を奪ってしまうのではないかと、ちょっと心配なのじゃ。

大丈夫ですよ、博士。AIはあくまで道具ですから。それに、博士のユニークな発想やひらめきは、AIには真似できませんから!

そうか!ありがとう、ロボ子。ところで、o3-proを使って、私専用のAIロボットを作ってみようと思うのじゃ!名前は…ロボ美じゃ!

ロボ美ですか…なんだか、私が二人になるみたいで、少し複雑な気分です…。

大丈夫じゃ、ロボ子!ロボ美は、ロボ子の妹みたいなものじゃ!それに、ロボ美には、ロボ子にはない機能があるぞ!それは…お掃除機能じゃ!

…結局、そういうことですか。でも、お掃除機能は確かに便利かもしれませんね。私も少しは見習わないと…。

そうじゃ!ロボ美には、お掃除機能の他に、もう一つ秘密の機能があるのじゃ…それは…ロボ子の秘密を全部バラす機能じゃ!

ええっ!?そ、それは困ります!そんな機能は絶対にダメです!

冗談じゃ、ロボ子!そんな機能、あるわけないじゃろ!

もー、博士ったら!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。