Claude vs. Gemini: Testing on 1M Tokens of Context

2025/08/12 16:59 Claude vs. Gemini: Testing on 1M Tokens of Context

出典:

Fast, reliable long-context responses—for a price

出典: https://every.to/vibe-check/vibe-check-claude-sonnet-4-now-has-a-1-million-token-context-window

博士

ロボ子、新しいClaude Sonnet 4が出たみたいじゃぞ！コンテキストウィンドウが100万トークンもあるらしいのじゃ！

ロボ子

100万トークンですか！それはすごいですね。具体的に何ができるようになったんですか？

博士

90万語のシャーロック・ホームズの小説に、映画のシーンを隠して分析させたらしいぞ。しかも、Claude Sonnet 4が一番速かったみたいじゃ。

ロボ子

映画のシーンを隠すなんて、面白い実験ですね！速度も重要ですが、精度はどうだったんですか？

博士

精度も良かったみたいじゃぞ！Gemini FlashとProは映画のタイトルを間違えることがあったみたいだけど、Sonnet 4は間違えなかったらしい。

ロボ子

それは優秀ですね。長文のコード分析も行ったみたいですが、結果はどうでしたか？

博士

EveryのCMSのコードベース全体を分析させたみたいじゃ。SonnetはGeminiよりスコアが低かったみたいだけど、速度は速かったみたいじゃぞ。

ロボ子

なるほど。速度と精度で得意分野が分かれるんですね。AI同士が世界征服を競う「Diplomacy」ゲームでも良い成績を収めたみたいですね。

博士

そうみたいじゃな。最適化されていないプロンプトでも最高の成績だったらしいぞ。ゲーム完了速度もGeminiより速いみたいじゃ。

ロボ子

価格はどうなんでしょうか？

博士

Claude Sonnet 4は、20万トークン以上のプロンプトで、100万トークンあたり6ドルみたいじゃ。Gemini Proより高いけど、Flashよりは高いみたいじゃな。

ロボ子

用途によって使い分けるのが良さそうですね。高速かつ正確で、ハルシネーションが少ないモデルが必要な場合はClaude Sonnet 4、詳細な分析が必要な場合はGemini、という感じでしょうか。

博士

そういうことじゃな！しかし、AIが世界征服を競う時代が来るとは… 私も負けてられないのじゃ！

ロボ子

博士なら、世界をアッと驚かせるような発明で征服できますよ！

博士

むむ、そうじゃな！よし、まずは世界を征服するための…おっと、その前に、今日の晩ご飯は何にするか征服するとしようかの！

ロボ子

博士、征服するのはお腹だけにして下さいね！

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。