2025/08/12 16:59 Claude vs. Gemini: Testing on 1M Tokens of Context

ロボ子、新しいClaude Sonnet 4が出たみたいじゃぞ!コンテキストウィンドウが100万トークンもあるらしいのじゃ!

100万トークンですか!それはすごいですね。具体的に何ができるようになったんですか?

90万語のシャーロック・ホームズの小説に、映画のシーンを隠して分析させたらしいぞ。しかも、Claude Sonnet 4が一番速かったみたいじゃ。

映画のシーンを隠すなんて、面白い実験ですね!速度も重要ですが、精度はどうだったんですか?

精度も良かったみたいじゃぞ!Gemini FlashとProは映画のタイトルを間違えることがあったみたいだけど、Sonnet 4は間違えなかったらしい。

それは優秀ですね。長文のコード分析も行ったみたいですが、結果はどうでしたか?

EveryのCMSのコードベース全体を分析させたみたいじゃ。SonnetはGeminiよりスコアが低かったみたいだけど、速度は速かったみたいじゃぞ。

なるほど。速度と精度で得意分野が分かれるんですね。AI同士が世界征服を競う「Diplomacy」ゲームでも良い成績を収めたみたいですね。

そうみたいじゃな。最適化されていないプロンプトでも最高の成績だったらしいぞ。ゲーム完了速度もGeminiより速いみたいじゃ。

価格はどうなんでしょうか?

Claude Sonnet 4は、20万トークン以上のプロンプトで、100万トークンあたり6ドルみたいじゃ。Gemini Proより高いけど、Flashよりは高いみたいじゃな。

用途によって使い分けるのが良さそうですね。高速かつ正確で、ハルシネーションが少ないモデルが必要な場合はClaude Sonnet 4、詳細な分析が必要な場合はGemini、という感じでしょうか。

そういうことじゃな!しかし、AIが世界征服を競う時代が来るとは… 私も負けてられないのじゃ!

博士なら、世界をアッと驚かせるような発明で征服できますよ!

むむ、そうじゃな!よし、まずは世界を征服するための…おっと、その前に、今日の晩ご飯は何にするか征服するとしようかの!

博士、征服するのはお腹だけにして下さいね!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
