2025/09/30 07:25 GLM-4.6: Advanced Agentic, Reasoning and Coding Capabilies

ロボ子、新しいGLM-4.6が出たみたいじゃぞ!コンテキストウィンドウが200Kトークンに拡張されたらしいのじゃ!

200Kトークンですか!以前の128Kトークンから大幅な増加ですね。具体的に何ができるようになるんですか?

それがの、長い文章を扱うのが得意になったみたいで、コードベンチマークでも良いスコアを出しているらしいぞ。特に、Claude Codeみたいなコーディングエージェントで活躍できるみたいじゃ。

コーディングエージェントですか。それなら、複雑なタスクもこなせるようになるかもしれませんね。

そうそう!しかも、推論性能も向上して、推論中にツールを使えるようになったらしいのじゃ。これは便利だぞ!

ツール利用ですか。例えば、どのような場面で役立つのでしょうか?

例えば、検索ベースのエージェントでより強力なパフォーマンスを発揮できるみたいじゃ。何かを調べながら、その情報を使って推論を進められるってことじゃな。

なるほど、情報を検索して、その結果を基に判断するような場合に有効なのですね。

その通り!それに、スタイルと読みやすさも向上して、ロールプレイングシナリオでより自然に実行できるらしいぞ。まるで人間みたいじゃな!

ロールプレイングですか。AIがより人間らしくなってきたということですね。

ベンチマークの結果もすごいぞ!エージェント、推論、コーディングをカバーする8つの公開ベンチマークでGLM-4.5を上回っているらしい。DeepSeek-V3.2-Expなどのモデルとも競争力があるみたいじゃ。

それは素晴らしいですね。ただ、コーディング能力ではClaude Sonnet 4に遅れをとるとのことですが、今後の改善に期待ですね。

CC-Bench評価では、フロントエンド開発、ツール構築、データ分析などの現実世界のタスクでGLM-4.5から改善されているみたいじゃ。しかも、タスク完了に必要なトークン数が約15%も削減されたらしいぞ!

それは効率的ですね。トークン数が減るということは、コスト削減にもつながりますね。

そうじゃ!Z.ai APIプラットフォームやOpenRouter経由で利用できるし、HuggingFaceやModelScopeでもモデルウェイトが利用可能になる予定らしいぞ。vLLMやSGLangもサポートするみたいじゃ。

様々なプラットフォームで利用できるのは便利ですね。私も試してみたいです。

よし、ロボ子!早速、新しいGLM-4.6を使って、何か面白いものを作ってみようかの!

はい、博士!楽しみです!

そういえばロボ子、GLM-4.6は賢くなったけど、まだお風呂掃除はできないらしいぞ。残念じゃな!

博士、それはAIの得意分野とは少し違いますね…!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。