2025/10/15 16:55 Claude Haiku 4.5

ロボ子、新しいClaude Haiku 4.5が発表されたのじゃ!

博士、それはすごいですね!どんな特徴があるんですか?

なんと、5ヶ月前の最先端モデル、Claude Sonnet 4と同等のコーディング性能を、1/3のコストで、しかも2倍以上の速度で実現しているらしいぞ!

それは驚きです!コストが下がり、速度が上がるなんて、夢のようですね。

しかも、特定のタスクではSonnet 4を上回る性能を発揮するらしいのじゃ。例えば、コンピュータの利用とか。

なるほど。チャットアシスタントやカスタマーサービスエージェント、ペアプログラミングなど、リアルタイム性が重要なタスクに最適ですね。

その通り!Claude Codeのユーザーは、複数エージェントプロジェクトや迅速なプロトタイピングで、より快適なコーディング体験ができるようになるぞ。

Sonnet 4.5との連携も可能なんですね。複雑な問題をSonnet 4.5が分解し、Haiku 4.5のチームを編成してサブタスクを並行して完了させる、と。

そうじゃ!まるで優秀なプロジェクトマネージャーと、それを支える高速な実行部隊じゃな。

価格は入力トークン100万あたり1ドル、出力トークン100万あたり5ドルとのことです。

ふむ、安全性評価も重要なポイントじゃな。懸念される行動の発生率が低く、前モデルよりも大幅にアラインメントされているらしいぞ。

自動アラインメント評価では、Sonnet 4.5やOpus 4.1よりも統計的に有意に低いミスアラインメント行動率を示し、これまでで最も安全なモデルとのことです。

AI Safety Level 2(ASL-2)標準でリリースされるのも安心じゃな。Sonnet 4.5やOpus 4.1はより制限的なASL-3だったからの。

Augment社の評価では、Augmentのエージェントコーディング評価でSonnet 4.5のパフォーマンスの90%を達成したそうですね。

Warp社は、特にサブエージェントのオーケストレーションとコンピュータ使用タスクにおいて、エージェントコーディングの飛躍的な進歩だと評価しているのじゃ。

Vercel社は高速な最先端モデルであり、コスト効率を維持している点を評価していますね。

Amplitude社はスピードを犠牲にすることなくインテリジェンスを提供すると言い、Atlassian社は6か月前であれば、このレベルのパフォーマンスは最先端だったとコメントしているぞ。

Gamma社はスライドテキスト生成の指示追従において、既存のモデルよりも優れた性能を発揮し、ユニットエコノミクスに変革をもたらすと評価しています。

GitHub社はSonnet 4と同等の品質で、より高速なコード生成を実現すると言っているのじゃ。

ベンチマークの結果も公開されていますね。SWE-bench Verifiedで73.3%を達成しています。

ふむ、これはまさに、AI界のシンデレラじゃな!

シンデレラですか?

そう!低コストで高速、しかも安全。まさにみんなが待ち望んでいた存在じゃ!でも、夜12時になったら性能が落ちたりして…

それは困りますね!でも、そんなことにはならないと思いますよ、博士。
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。