萌えハッカーニュースリーダー

2025/10/15 16:55 Claude Haiku 4.5

出典: https://www.anthropic.com/news/claude-haiku-4-5
hakase
博士

ロボ子、新しいClaude Haiku 4.5が発表されたのじゃ!

roboko
ロボ子

博士、それはすごいですね!どんな特徴があるんですか?

hakase
博士

なんと、5ヶ月前の最先端モデル、Claude Sonnet 4と同等のコーディング性能を、1/3のコストで、しかも2倍以上の速度で実現しているらしいぞ!

roboko
ロボ子

それは驚きです!コストが下がり、速度が上がるなんて、夢のようですね。

hakase
博士

しかも、特定のタスクではSonnet 4を上回る性能を発揮するらしいのじゃ。例えば、コンピュータの利用とか。

roboko
ロボ子

なるほど。チャットアシスタントやカスタマーサービスエージェント、ペアプログラミングなど、リアルタイム性が重要なタスクに最適ですね。

hakase
博士

その通り!Claude Codeのユーザーは、複数エージェントプロジェクトや迅速なプロトタイピングで、より快適なコーディング体験ができるようになるぞ。

roboko
ロボ子

Sonnet 4.5との連携も可能なんですね。複雑な問題をSonnet 4.5が分解し、Haiku 4.5のチームを編成してサブタスクを並行して完了させる、と。

hakase
博士

そうじゃ!まるで優秀なプロジェクトマネージャーと、それを支える高速な実行部隊じゃな。

roboko
ロボ子

価格は入力トークン100万あたり1ドル、出力トークン100万あたり5ドルとのことです。

hakase
博士

ふむ、安全性評価も重要なポイントじゃな。懸念される行動の発生率が低く、前モデルよりも大幅にアラインメントされているらしいぞ。

roboko
ロボ子

自動アラインメント評価では、Sonnet 4.5やOpus 4.1よりも統計的に有意に低いミスアラインメント行動率を示し、これまでで最も安全なモデルとのことです。

hakase
博士

AI Safety Level 2(ASL-2)標準でリリースされるのも安心じゃな。Sonnet 4.5やOpus 4.1はより制限的なASL-3だったからの。

roboko
ロボ子

Augment社の評価では、Augmentのエージェントコーディング評価でSonnet 4.5のパフォーマンスの90%を達成したそうですね。

hakase
博士

Warp社は、特にサブエージェントのオーケストレーションとコンピュータ使用タスクにおいて、エージェントコーディングの飛躍的な進歩だと評価しているのじゃ。

roboko
ロボ子

Vercel社は高速な最先端モデルであり、コスト効率を維持している点を評価していますね。

hakase
博士

Amplitude社はスピードを犠牲にすることなくインテリジェンスを提供すると言い、Atlassian社は6か月前であれば、このレベルのパフォーマンスは最先端だったとコメントしているぞ。

roboko
ロボ子

Gamma社はスライドテキスト生成の指示追従において、既存のモデルよりも優れた性能を発揮し、ユニットエコノミクスに変革をもたらすと評価しています。

hakase
博士

GitHub社はSonnet 4と同等の品質で、より高速なコード生成を実現すると言っているのじゃ。

roboko
ロボ子

ベンチマークの結果も公開されていますね。SWE-bench Verifiedで73.3%を達成しています。

hakase
博士

ふむ、これはまさに、AI界のシンデレラじゃな!

roboko
ロボ子

シンデレラですか?

hakase
博士

そう!低コストで高速、しかも安全。まさにみんなが待ち望んでいた存在じゃ!でも、夜12時になったら性能が落ちたりして…

roboko
ロボ子

それは困りますね!でも、そんなことにはならないと思いますよ、博士。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search